sitemap - sitemap.xml文件中是否允许使用通配符?

标签 sitemap wildcard web-crawler sitemap.xml

我有一个网站,该网站的目录包含100多个html文件。
我希望搜寻器搜寻该目录下的所有html文件。
我已经在robots.txt中添加了以下句子:

Allow /DirName/*.html$

有什么方法可以将文件包含在sitemap.xml文件的目录中,以便对该目录中的所有html文件进行爬网?
像这样:
<url>
    <loc>MyWebsiteName/DirName/*.html</loc>
</url>

最佳答案

sitemap protocol既不限制也不允许使用通配符。老实说,这是我第一次听到这个消息。另外,我非常确定搜索引擎无法利用站点 map 中的通配符。

请查看Google对sitemap generators的推荐。您可以在瞬间创建大量站点 map 的工具。

关于sitemap - sitemap.xml文件中是否允许使用通配符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3367456/

相关文章:

url重写的Grails站点地图问题

c# - 从带有图像的 XSD 站点地图生成 C# 类

ruby-on-rails - 在 Rails 3.1 中构建站点地图

具有自定义文件保存能力的Java爬虫

go - 使用 goroutine 更改样本?

c# - 将 X-Robot-Tag 添加到 Sitecore 8 中的响应 header

java - 如何在C#中模拟Java泛型通配符

java - 使用通配符过滤文件 (java)

java - 为什么要定义多个导入?

python - 从多个网站提取文本