嗨,谁能给我提供 python 代码来提取文本文件中的公司名称日期和时间并将输出保存到 csv 中?示例格式(.txt)如下
通用磨坊第二季度利润预测高于预期
173字
2014 年 12 月 17 日 上午07:25
美联社通讯社
APRS
英语
(c) 2014 年。美联社。版权所有。
明尼阿波利斯(美联社)?通用磨坊公司 (GIS) 周三公布第二财季盈利 3.461 亿美元。
这家总部位于明尼阿波利斯的公司表示,每股利润为 56 美分。根据重组成本调整后的 yield 为每股 80 美分。
结果超出了华尔街的预期。 Zacks Investment Research 调查的分析师平均预期每股 yield 为 76 美分。
这家生产 Cheerios 麦片、Yoplait 酸奶和其他包装食品的制造商公布的同期收入为 47.1 亿美元,低于华尔街的预测。 Zacks 表示,分析师预计 48.4 亿美元。
自今年年初以来,通用磨坊 (General Mills) 股价已上涨略高于 2%,而标准普尔 500 指数则上涨了近 7%。该股在过去 12 个月中上涨了 2% 以上。
这个故事是由 Automated Insights 使用 Zacks Investment Research 的数据生成的。 Zacks 的 GIS 股票研究报告。
关键字:通用磨坊、 yield 报告
<小时/>我使用以下代码来提取日期和时间
import os,csv,datefinder,datetime
os.chdir('C:\Users\dul\Desktop\Article')
with open("test2.txt", 'r') as file1:
text1=file1.read()
matches = list(datefinder.find_dates(text1))
if len(matches) > 0:
date=matches[1]
print date
else:
print 'No dates found'
但我不知道如何捕获“这个故事已生成”和公司名称......请帮忙!谢谢!
最佳答案
看来您可以提取关键字
中的第一项。
import re
re.search(r'Keywords:([^,]*)(,|$)', text1).group(1).strip()
关于python - 提取 "This story was generated,"公司名称、日期、时间(.txt)并将输出保存到python 2.7中的csv中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54657690/