.htaccess - Robots.txt、php.ini、connect_to_database.php、.htaccess

标签 .htaccess web-crawler seo robots.txt googlebot

我似乎无法在任何地方找到关于我是否应该禁止配置文件如 /php.ini 或隐藏文件如 /.htaccess 的答案?还有像 /includes/includes/connect_to_database.php 这样的东西呢?

我已经在 ProWebmasters 和其他地方读到我们不应该 disallow:/*.js$/*.css$,但几乎所有这些答案快十年了。此外,robots.txt 的目的是确定索引的内容,而不是抓取的内容,不是吗?我的意思是,我们不希望爬虫试图索引我们的 cssjs 文件。

即使是 Google 自己关于 robots.txt 的文档似乎也没有涵盖这些内容。有人知道网络上某处与此相关的信息资源吗?

谢谢

最佳答案

在网络浏览器和搜索蜘蛛(例如 Google Bot)中呈现整个页面所需的文件应该在 robots.txt 文件中可用。允许文件 css、js、图像 jpg、jpeg、png、字体。

PHP 加载的文件(include() 和 require(),例如 connect_to_database.php)和配置文件 (php.ini) 应该是公众无法访问的,并在 .htaccess 文件中被阻止。

关于.htaccess - Robots.txt、php.ini、connect_to_database.php、.htaccess,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57365583/

相关文章:

apache - .htaccess - 重定向网站图标

python - 无法理解在源代码中查找何处以创建网络抓取工具

python - 通过网络表单提交数据并提取结果

Joomla 不使用别名?

html - 我应该使用多个 h1 还是不使用 h1 的多个 h2?

.htaccess - 如何将查询字符串附加到错误文档

.htaccess - 从 OpenCart 中删除 index.php?route=

php - 如何自动将 <a> 中的 url 更改为 Opencart 2.x 中的 seo?

search - Google 如何确定将页面编入索引作为讨论页面?

python - python 中的网络爬虫。我应该从哪里开始,我应该遵循什么? - 需要帮助