我在重定向通配符子域和处理内部 URL 缩短器时遇到问题。
假设我的应用程序中有一个内部 URL 缩短器
example.com/b/ABCDE
会翻译
example.com/book/12345678-the-book-name
/b/
引用的脚本(我使用的是可以处理 URL 规则的 PHP 框架)会将短 ID ABCDE
转换为图书真实 ID 12345678
(和标题“The Book Name”)然后将其重定向到该书的永久 URL example.com/book/12345678-the-book-name
所以每次我在公告板、微博网站或海报或名片等物理媒体上传播关于一本书的链接时,我都会使用短链接(example.com/b/ABCDE
) 而不是永久链接 (example.com/book/12345678-the-book-name
)。
接下来,我需要将所有通配符子域重定向到主域 (www.example.com
),同时维护请求 URI,例如
http://random.example.com/book/11111111-some-book -> http://www.example.com/book/11111111-some-book
http://123456.example.com/book/22222222-another-book -> http://www.example.com/book/22222222-another-book
http://abcdefg.example.com/book/33333333-another-book-again -> http://www.example.com/book/33333333-another-book-again
在我使用的所有规则之后添加下面的规则
<VirtualHost *:80>
ServerName example.com
ServerAlias *.example.com
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www.example.com [NC]
RewriteRule ^/(.*)$ http://www.example.com/$1 [R=301]
</VirtualHost>
因此,带有 example.com 域且没有前缀的 url 如下所示
http://example.com/book/11111111-some-book
将转化为
http://www.example.com/book/11111111-some-book
而且,另一个后果是,如果内部 URL 缩短器使用没有前缀的普通域,则需要两次重定向才能解析。例如,
http://example.com/b/ABCDE
首先会被重定向到
http://www.example.com/b/ABCDE
然后被重定向到
http://www.example.com/book/12345678-the-book-name
其实,我不介意两次重定向。但是我的 SEO 顾问说两次重定向对我网站的 SEO 不利。 (我仍然不知道为什么)
所以我尝试将最后一条规则更改为以下
<VirtualHost *:80>
ServerName example.com
ServerAlias *.example.com
RewriteEngine on
RewriteCond %{HTTP_HOST} ^example.com [NC]
RewriteCond %{REQUEST_URI} ^/b/(.*)$
RewriteRule . index.php [L]
RewriteCond %{HTTP_HOST} !^www.example.com [NC]
RewriteRule ^/(.*)$ http://www.example.com/$1 [R=301]
</VirtualHost>
我不太擅长配置 Apache,但是当我在 http://htaccess.madewithlove.be/ 中模拟上述规则时,它起作用了。但是当我将它应用到我的服务器时,它为 example.com/p/ABCDE
提供了 400 Bad Request。
所以,我的问题是
- 我的 SEO 顾问的论点是否正确?有什么解释可以支持他或有反驳吗?
- 为什么服务器给了400 Bad Request?
- 如何修复重定向?我想保留短网址(
example.com/b/ABCDE
,不带www
前缀)但仍处于一次重定向中。
最佳答案
你是SEO顾问吗?
作为 SEO 的所有内容,答案涉及一些猜测和假设,但他可能是对的。
当您重定向页面时,您告诉抓取工具忘记初始页面并稍后返回以索引目标页面,这会在您的页面首次向世界介绍和页面实际出现之间引入延迟在搜索结果中。两次重定向意味着您将延迟加倍。根据搜索引擎的“情绪”,这可能会导致您的 SEO 出现显着倒退(或者在搜索引擎对重定向进行排序时,您的索引 URL 会出现一些困惑)。
为什么会收到 400 响应
如果您查看 RewriteRule 的文档, 条目内部每服务器配置
给定规则 --> 结果替换
^/somepath(.*) --> otherpath$1
: 无效,不支持
^/somepath(.*) -->/otherpath$1
: /otherpath/pathinfo
这意味着,在 vhost conf 中,你必须为你的替换提供一个绝对路径(最后一个将返回给 Apache,之前的可以是你喜欢的任何东西)。解决400错误:
重写规则。/index.php [L]
如何修复重定向
这将取决于你的 index.php 如何构建它的重定向,但是设置
ServerName www.example.com
UseCanonicalName On
将 $_SERVER["SERVER_NAME"]
设置为 www.example.com
并且应该生成指向规范域的 URL。
潜在的 session
<VirtualHost *:80>
ServerName www.example.com
ServerAlias *.example.com example.com
UseCanonicalName On
RewriteEngine on
#set the document root
DocumentRoot /path/to/the/app
# if something goes wrong, setup logs to track what happens
# comment these lines when you're done
ErrorLog /a/path/to/a/log/file
RewriteLogLevel 5
RewriteLog /a/path/to/another/log/file
# I simplified the conditions, those are equivalent to your rules
# a RewriteRule tries to match against %{REQUEST_URI}
RewriteCond %{HTTP_HOST} ^example\.com [NC]
RewriteRule ^/b/ /index.php [L]
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule ^/(.*)$ http://www.example.com/$1 [R=301]
</VirtualHost>
关于Apache Rewrite - 重定向通配符子域和处理内部 URL 缩短器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10974852/