html - 使用 htaccess 修复拼写错误的网址

标签 html apache .htaccess url

所以我的网站有一个非常简单的问题(至少我认为是这样)。我需要能够将任何拼写错误的 URL 重定向到正确的 URL。如果我向你们解释它比描述它更容易。

例如,让我们使用这个 url。

http://www.tomshardware.com/reviews/radeon-r9-290x-hawaii-review,3650.html

现在,无论 url 的拼写如何,该 url 都会将您带到该文章的正确页面。假设您不小心将字母、数字或单词放入该 URL 中,如下所示:

http://www.tomshardware.com/reviews/radeon-r9-290x-TEST-TEST-hawaii-review,3650.html

该 url 仍会将您带到正确的文章并将其自身固定为正确的 URL。您可以向该 URL 添加任何内容,无论您不小心输入了什么内容,它仍会将您带到正确的文章。

所以我的问题是如何在 htaccess 中执行此操作?这是我当前的 htaccess 文件

# Secure htaccess file
<files .htaccess>
order allow,deny
deny from all
</files>

AddHandler application/x-httpd-php5 .html .htm
AddType application/x-httpd-php .html .htm .php
AddHandler cgi-script .pl .cgi
Options ALL -Indexes -Multiviews +ExecCGI +FollowSymLinks

# Do not remove this line, otherwise mod_rewrite rules will stop working
RewriteBase /

RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME}\.html -f
RewriteRule ^(.*)$ $1.html

#Redirect Non-WWW to WWW
RewriteCond %{HTTP_HOST} !^www\.
RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]

RewriteCond %{REQUEST_URI} /index\.html?$ [NC]
RewriteRule ^(.*)index\.html?$ "/$1" [NC,R=301,NE,L]

最佳答案

你可能不能那样做。

如您所见,url 上的文本完全无关紧要,仅用于创建可读且索引友好 (SEO) 的 url。这些词被称为“鼻涕虫”,参见 http://en.wikipedia.org/wiki/Clean_URL#Slug 如果您修改最后一部分,3650 将破坏 url,因为这是通常对应于数据库中唯一 ID 的唯一标识符。

关于上述网站如何以及为何这样做的假设: 该站点使用独立的路由组件(例如来自 Symfony PHP 框架的路由:http://symfony.com/components/Routing),整个 Web 框架或所有内容都是手写的。根据语言的不同,对于 PHP,它可能是 ZEND、Symfony 等,对于 Asp.net 或任何其他语言,它可能是 MVC。

在所有情况下,在提供原始内容之前都会对 url 进行某种过滤。 路由解析 url,检索唯一 ID,获取数据集并从中再次创建绝对 URL。 然后它将新生成的路线与您输入的路线进行比较。 如果它们不匹配,框架会发出 30x 的 http 状态并将您重定向到新的 url。 这样做的目的是在 slug 标签发生变化或出于任何原因 SEO 友好的 url 布局发生变化时保持链接的完整性。 重定向在那里,所以老式的 url 会在下次搜索引擎访问该页面并更新它的索引时更新。 想象一下,您在 slug 的某处有错字,或者您忘记提及 Radeon,并且您希望避免它在数据库中永远损坏或出错。 因此,您需要修复它,但同时您希望避免破坏旧的搜索索引 url,因为新 slug 或已将其加入书签的用户尚未重新访问您的站点。

重定向后,它再次比较 url,在它们匹配后提供内容。

此处很可能会进行数据库查找,您无法单独使用 htaccess 正确执行此操作,因为您不知道此处 url 的正确性。

关于html - 使用 htaccess 修复拼写错误的网址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20652794/

相关文章:

jquery - 适用于所有设备的 HTML5 应用程序的媒体查询

javascript - 带有 csv 值的直方图

html - 如何从 Firefox 中的选择元素中删除箭头

linux - Mattermost 的 Apache 反向代理 : No protocol handler was valid for the URL/api/v4/websocket

PHP 路由 - 包含 css/js 文件时出错

javascript - 删除带有动态添加按钮的动态添加的 TinyMCE 文本框

apache - 在特定目录上使用 mod_evasive

java - Apache James邮件服务器的优点和使用?

.htaccess - 如何使用 .htaccess 从子域重定向到子文件夹

wordpress - 如何阻止过度访问我的网站的机器人?