几个月来,我们的 IIS/ColdFusion 服务器在 Google 爬虫扫描期间一直抛出 404 错误。通常很容易追踪到这些,但在这种情况下,谷歌正在尝试扫描我们的 CFC 文件。这些文件确实存在,但它们不会暴露在 Internet 上——只暴露给 ColdFusion 服务器。尽管如此,谷歌还是在我们网站的某处看到了指向 CFC 的链接,并试图关注它们。
下面是我们在 404 中的一个 CGI 结构的转储。 baseCFC
是到 D:\Domains\[domain]\cfc
的 CF 映射.所有对 baseCFC
的引用在我们的源代码中要么是在 <cfajaxproxy>
中标签,或 CreateObject()
调用 Application.CFC(下面的示例)。
或许这是一个重要的线索:baseCFC
指 D:\Domains\[domain]\cfc
,但 Google 正试图联系 D:\Domains\[domain]\www\baseCFC
,这是我们网站的主目录。显然 Google 看到了 baseCFC
作为服务器上的普通(未映射)目录并希望对其进行扫描。
以下是 baseCFC
两种类型的示例我们代码中的引用:<cfajaxproxy cfc="baseCFC.Misc" jsclassname="ajxMisc">
创建对象():<cfscript>
request.Misc = CreateObject( "component", "baseCFC.Misc" );
</cfscript>
我们如何解决这些与 CFC 相关的 404 错误?谢谢!
最佳答案
由 cfajaxproxy
创建的 javascript包括 cfc 的位置。查看页面的源代码,您应该能够找到字符串 '/baseCFC/Statement.cfc'
.这就是谷歌寻找它们的方式。
让 Google 忽略它们的快速方法是修改您的 robots.txt
文件以排除 baseCFC
“目录”。
User-Agent: *
Disallow: /baseCFC/
关于iis - 404 错误 - Google 尝试索引 ColdFusion CFC,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12899796/