python - 使用文本特征提取创建数据集

标签 python python-3.x machine-learning nlp named-entity-recognition

我正在尝试从恐怖事件的文本数据中提取一些特征来创建数据集。使用名称实体识别,我已经成功提取了名称、地点、组织等特征,现在我想提取参与事件的成员数量。

The 2008 Mumbai attacks (also referred to as 26/11) were a series of terrorist attacks that took place in
November 2008, when 10 members of Lashkar-e-Taiba, a terrorist organization based in Pakistan,
carried out 12 coordinated shooting and bombing attacks lasting four days across Mumbai.

如何从上面的文本中提取10名虔诚军成员并将10放入攻击者数量栏中。 使用 nlp 技术是否可以实现这一点?

最佳答案

对您的情况有用的两种技术是 - 依赖项解析和语义角色标记。您可能还想查找基于方面的情感分析。所有这三个都可以帮助识别句子中单词之间的关系。

关于python - 使用文本特征提取创建数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59573802/

相关文章:

python - .find 不返回完整对象

python - 将Qcombobox的Qsettings写入文件而不关闭Widget

python - 在 Python 中使用 psycopg2 将 PostgreSQL hstore 作为 OrderedDict 返回

python-3.x - 可视化 asyncio 协程执行

python - 如何重置 Keras 指标?

python - CNN 模型无法做出预测

python - 使用 Python 检查列表中的前一个元素,并使用 Pandas 根据前一个元素将值存储在新列中

mysql - 为什么我们不能使用我们自己的mysql数据库而不是django数据库?

python - 使用 OSMNx 绘制多条路线

javascript - 给定字典和字母列表,让程序学习生成有效单词 | Javascript