c# - 使用 C# 抓取网页 (html)

标签 c# html regex xpath

这只是一个一般性问题。目前我正在使用正则表达式进行网页抓取。但我认为有时很难找出正则表达式,所以我在想 XSL/XPath 是否可以替代 C# 中的正则表达式?

另外,我想知道除了上面列出的两种之外,是否还有更高级的网页抓取技术。谢谢。

最佳答案

你可以看看SgmlReaderHtml Agility Pack这是 .NET 的 HTML 解析库。

关于c# - 使用 C# 抓取网页 (html),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5020473/

相关文章:

c# - 在 C# 中替换字符串的连续实例

html - 使div(height)占据父级剩余高度

java - 如何从 Android/Java 中的字符串中获取多个子字符串?

c# - 如何在不丢失 WPF 中的绑定(bind)的情况下更改 TextBox.Text?

c# - 使用什么技术来编写在语言之间切换的解析器?

javascript - 如何在静态网站上制作 "adult content warning"?

html - 动态折叠 div 错误对齐 - Wordpress

regex - 如何掌握正则表达式?

c# - 如何确保 Linq to Sql 不会覆盖或违反不可为 null 的数据库默认值?

c# - 更漂亮的不格式化 Unity C# 代码 - "Cannot format Movement.cs"