以编程方式将大量非常相似的网页转换为较新的基于 css 的布局的最佳方法是什么?
我正在将一个旧网站的所有内容更改为一个新的基于 css 的布局。许多页面都非常相似,我希望能够自动化该过程。
我目前想做的是阅读使用 HtmlAgilityPack 的页面,并为每组相似页面创建一个方法来创建输出文本。
您认为最好的方法是什么?这些页面的主要区别在于图像使用了哪个 .jpg 文件,或者该特定页面上有多少组标题图像文本
编辑:我不能使用除 .html 以外的任何其他文件类型,因为这是我有权做的所有事情。有什么建议吗?
EDIT2:理想情况下,我还可以使它足够通用,只需切换几个移动部件,我就可以将它用于许多不同的 html 文件组。
上面的链接是我正在处理的示例。页面之间不同的部分是:
- 元描述标签
- 各种标题,尤其是主标题
- 页面上几乎每张图片都是新的
- 每个视频的文本都是独一无二的,但它们会以相似的 block 组合在一起
- 视频文件和视频大小都是独一无二的
其他都一样,页面的格式也一样。
EDIT3:当有疑问时,另一件可能有用的事情是编写一些代码来为我编写页面。我只需要剪掉原件中可变的部分,并将它们放入一个数据文件中,该数据文件被读取并用于写入新版本。
最佳答案
这取决于“非常相似”实际上有多相似。如果您的意思是他们有效地使用了许多模板,那么我可能会使用 Template-Toolkit 为新设计构建新模板。并使用 Template::Extract 吸出数据.可能将数据存储在本地数据库中,以便将来更容易重建页面。
关于html - 如何将大量类似的糟糕 html 页面转换为高质量的基于 css 的页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/794405/