我的老板最近带着安全问题来找我。
我的公司进行研究,然后向客户发送一份报告(该报告对于每个客户来说都是唯一的,并且包含有关其业务的识别信息)。
我们通过电子邮件将报告发送给客户,但我们也会将其上传到我们的服务器,并向客户提供一个包含哈希值的 URL,客户可以使用该 URL 随时在线访问报告。 (换句话说,任何知道链接的人都可以访问该报告) 该链接看起来像:
- http://www.our_website.com/report_page.php?33355-fn347rhwfh83j3f (这里只是放置随机字符串作为哈希值的位置)
页面背后的代码执行以下操作:
- 分解哈希并使用它在数据库中查找报告信息
- 根据报告 ID 和电子邮件验证此哈希确实有效
- 从服务器检索报告 pdf 并显示它。
如果网址中的哈希不存在或无效,用户会收到“无效”消息。
他的问题是:
Clicking on the link opens the report, does this mean that Google can index these pages and they may appear in Google's search results for the whole world to see?
我的直觉是,不,如果爬虫到达report_page.php,它会看到无效消息,除非它以某种方式具有有效的散列,但我不确定这一点,并且在搜索之后周围,我没有想出任何东西来证明我是对的(或错的)。
有什么想法吗?谢谢!
最佳答案
如果该网址发布在可公开访问的页面上,那么 Google 抓取工具就会找到它,并且该页面将被编入索引。从你的说法来看,这听起来不太可能,所以你应该是安全的。如果您的客户碰巧公开了该 URL,那么 Google 将会对其进行抓取并编制索引。它类似于密码:保密即可确保安全。
关于security - secret URL 可以被搜索引擎索引吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4254009/