php - 用于 php 的 html 文本提取

标签 php text-extraction boilerplate boilerpipe

有很多 HTML 文本提取工具。主要用于 Java 或 Python。我最常遇到的是锅炉管。这里和那里有一些 API,有些似乎工作得很好。有谁知道 PHP 中的任何东西吗?

最佳答案

你可以试试 phpQuery:

http://code.google.com/p/phpquery/

关于php - 用于 php 的 html 文本提取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11379186/

相关文章:

regex - 提取所有唯一行

javascript - JQuery插件,多个实例同一页面;适用于元素类和唯一元素 ID;用 $.data 保护选项;公共(public)访问功能

php - 使用 MySQL 检测垃圾邮件发送者

php - 使用 php 函数格式化 JSON 值并在 div#id 中打印结果

excel - 从 HTML 标记内的文件中抓取文本

visual-c++ - Windows 凭据提供程序、过滤器和解锁工作站方案

monads - 为什么在编写新的 Monad Transformers 时使用样板

php - 为什么在此示例中使用 tmp_name

上传图片时PHP表单处理错误

javascript - 从网页结果中提取 URL 并在 Iframe 中显示该 URL