python - 提取 "This story was generated,"公司名称、日期、时间(.txt)并将输出保存到python 2.7中的csv中

嗨，谁能给我提供 python 代码来提取文本文件中的公司名称日期和时间并将输出保存到 csv 中？示例格式(.txt)如下

通用磨坊第二季度利润预测高于预期

173字

2014 年 12 月 17 日上午07:25

美联社通讯社

APRS

英语

明尼阿波利斯(美联社)？通用磨坊公司 (GIS) 周三公布第二财季盈利 3.461 亿美元。

这家总部位于明尼阿波利斯的公司表示，每股利润为 56 美分。根据重组成本调整后的 yield 为每股 80 美分。

结果超出了华尔街的预期。 Zacks Investment Research 调查的分析师平均预期每股 yield 为 76 美分。

这家生产 Cheerios 麦片、Yoplait 酸奶和其他包装食品的制造商公布的同期收入为 47.1 亿美元，低于华尔街的预测。 Zacks 表示，分析师预计 48.4 亿美元。

自今年年初以来，通用磨坊 (General Mills) 股价已上涨略高于 2%，而标准普尔 500 指数则上涨了近 7%。该股在过去 12 个月中上涨了 2% 以上。

这个故事是由 Automated Insights 使用 Zacks Investment Research 的数据生成的。 Zacks 的 GIS 股票研究报告。

关键字:通用磨坊、 yield 报告
<小时/>
我使用以下代码来提取日期和时间

import os,csv,datefinder,datetime os.chdir('C:\Users\dul\Desktop\Article') with open("test2.txt", 'r') as file1: text1=file1.read() matches = list(datefinder.find_dates(text1)) if len(matches) > 0: date=matches[1] print date else: print 'No dates found'

但我不知道如何捕获“这个故事已生成”和公司名称......请帮忙!谢谢!

最佳答案

看来您可以提取关键字中的第一项。

import re re.search(r'Keywords:([^,]*)(,|$)', text1).group(1).strip()

关于python - 提取 "This story was generated,"公司名称、日期、时间(.txt)并将输出保存到python 2.7中的csv中，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54657690/

python - 提取 "This story was generated,"公司名称、日期、时间(.txt)并将输出保存到python 2.7中的csv中

嗨，谁能给我提供 python 代码来提取文本文件中的公司名称日期和时间并将输出保存到 csv 中？示例格式(.txt)如下

上一篇：python - 对于 PiCameraCircularIO 类 'copy_to()' 函数，Mjpeg 中的流输出的 'first_frame' 的类型是什么？

下一篇：python - Dask 依赖图中的容错