这只是一个一般性问题。目前我正在使用正则表达式进行网页抓取。但我认为有时很难找出正则表达式,所以我在想 XSL/XPath 是否可以替代 C# 中的正则表达式?
另外,我想知道除了上面列出的两种之外,是否还有更高级的网页抓取技术。谢谢。
最佳答案
你可以看看SgmlReader或 Html Agility Pack这是 .NET 的 HTML 解析库。
关于c# - 使用 C# 抓取网页 (html),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5020473/