javascript - 在 Javascript 中完全迭代/抓取 HTML 文档

标签 javascript html web-scraping firefox-addon-webextensions

我对 Web 开发相当陌生,包括 HTML/CSS 和 Javascript。

有没有办法只使用普通 JS 来抓取整个 HTML 文档,在其内部文本中查找某些模式?

我需要从文档中提取/识别不同形式的 IP 地址,即使是那些未用“a”标签标记但仍符合 RFC 的 IP 地址文本表示形式的 IP 地址。

此功能应该是使用 Mozilla 的 WebExtensions API 编写的插件的一部分。因此我试图避免使用外部库。

提前谢谢您!

最佳答案

以下怎么样,

grep -iohP '(?<=\x3e)([0-9]+\.){3}[0-9]+(?=\x3c)' file

引用:Extract IP address from HTML document

虽然在js中你可能必须使用jQuery.grep()

关于javascript - 在 Javascript 中完全迭代/抓取 HTML 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48064769/

相关文章:

javascript - 如何通过模糊 Google Maps JavaScript API 使用自定义控件

asp.net - 在 ASP.NET MVC 2 中实现一个普通网站

html - <select> 和 :after with CSS in WebKit 的问题

Python - 使用 BeautifulSoup 从 URL 列表中抓取文本的最简单方法

python - Beautifulsoup - 收集 href 链接并创建链接列表

java - 仅从网页中抓取特定详细信息

javascript - 自动扩展文本区域后跳转滚动条

javascript - 使 TouchableOpacity 在开始滚动时不突出显示元素 [React Native]

javascript - 如何在列表中的 ng-options 上预选多行

Javascript 不适用于 ajax 生成的部分