基本上,我想在删除停用词后提取网页中存在的关键字或词或标记。有人知道怎么做这个吗? C# 中的代码将不胜感激。
最佳答案
使用像 HTML Agility Pack 这样的 HTML 解析库.
用它加载 HTML 文档后,您可以使用 Xpath 语法查询它 - 它以类似于 XmlDocument
的方式公开 HTML。
关于c# - 如何从 C# 中的 HTML 页面中提取关键字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2798992/