c# - 如何从 C# 中的 HTML 页面中提取关键字?

标签 c# html-parsing

基本上,我想在删除停用词后提取网页中存在的关键字或词或标记。有人知道怎么做这个吗? C# 中的代码将不胜感激。

最佳答案

使用像 HTML Agility Pack 这样的 HTML 解析库.

用它加载 HTML 文档后,您可以使用 Xpath 语法查询它 - 它以类似于 XmlDocument 的方式公开 HTML。

关于c# - 如何从 C# 中的 HTML 页面中提取关键字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2798992/

相关文章:

c# - WinApp 窗体在 Load 事件期间加载过多数据

c# - 从 Session 中清理非托管资源,如 Crystal Report Document

c# - 尝试解析 html 以进行 pdf 转换时出现 ItextSharp 错误

java html解析器不读取所有页面

c# - 如何对分组列表的列表进行分组?

c# - iOS 设备上缺少日期时间解析

c# - 如何在 Internet Explorer 的网页上从 javascript 调用 .Net 控件或类库?

python - BeautifulSoup:如何用跨度标签替换内容

python - 以编程方式解析网页(使用登录名/ssl)

javascript - 如何将 HTML 字符串转换成 HTML 文档?