php - DBpedia信息抽取框架

标签 php frameworks extract text-extraction information-extraction

有人用过维基百科数据提取吗?我需要用它来工作。

您能否提供其他用于提取网页信息的工具?

谢谢!

最佳答案

当您说维基百科数据提取时,我假设您指的是 software DBpedia 用于将 Wikipedia XML 转储转换为 DBpedia data dumps ?您是否考虑过使用 DBpedia 转储本身?

从网页中提取信息的工具是一个非常广阔的领域。您想提取什么样的信息?它来自半结构化(例如表格)还是非结构化文本(例如散文)。您对页面标题和作者等元数据或命名实体等较低级别的概念感兴趣吗?

(我本来会在问题上留下这些澄清问题,但我的帐户级别不允许)

关于php - DBpedia信息抽取框架,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4175237/

相关文章:

php - Elastic Search 对多个字段进行模糊匹配,并对多个字段组合得分进行排序

php - 对于非常高流量的网站,我应该考虑哪些要点

java - 构建框架时要考虑的事项

python - 美丽汤 body 提取

python - 如何在提取包含多个值的 CSV 文件后构建实例

php - 如何统计数据库中meta_value的使用次数

php - 如何每 500 毫秒在 linux 中执行一次代码?

mysql - 在 html 页面上进行内部化

python - 在python中使用tabulizer循环遍历pdf文件

php - 在php中比较和过滤两个xml文件