python - 提取 "This story was generated,"公司名称、日期、时间(.txt)并将输出保存到python 2.7中的csv中

标签 python

嗨,谁能给我提供 python 代码来提取文本文件中的公司名称日期和时间并将输出保存到 csv 中?示例格式(.txt)如下

通用磨坊第二季度利润预测高于预期

173字

2014 年 12 月 17 日 上午07:25

美联社通讯社

APRS

英语

(c) 2014 年。美联社。版权所有。

明尼阿波利斯(美联社)?通用磨坊公司 (GIS) 周三公布第二财季盈利 3.461 亿美元。

这家总部位于明尼阿波利斯的公司表示,每股利润为 56 美分。根据重组成本调整后的 yield 为每股 80 美分。

结果超出了华尔街的预期。 Zacks Investment Research 调查的分析师平均预期每股 yield 为 76 美分。

这家生产 Cheerios 麦片、Yoplait 酸奶和其他包装食品的制造商公布的同期收入为 47.1 亿美元,低于华尔街的预测。 Zacks 表示,分析师预计 48.4 亿美元。

自今年年初以来,通用磨坊 (General Mills) 股价已上涨略高于 2%,而标准普尔 500 指数则上涨了近 7%。该股在过去 12 个月中上涨了 2% 以上。

这个故事是由 Automated Insights 使用 Zacks Investment Research 的数据生成的。 Zacks 的 GIS 股票研究报告。

关键字:通用磨坊、 yield 报告

<小时/>

我使用以下代码来提取日期和时间

import os,csv,datefinder,datetime

os.chdir('C:\Users\dul\Desktop\Article')


with open("test2.txt", 'r') as file1:
  text1=file1.read()

matches = list(datefinder.find_dates(text1))

if len(matches) > 0:
date=matches[1]
print date
else:
print 'No dates found'

但我不知道如何捕获“这个故事已生成”和公司名称......请帮忙!谢谢!

最佳答案

看来您可以提取关键字中的第一项。

import re
re.search(r'Keywords:([^,]*)(,|$)', text1).group(1).strip()

关于python - 提取 "This story was generated,"公司名称、日期、时间(.txt)并将输出保存到python 2.7中的csv中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54657690/

相关文章:

python - 获取整数的第 n 个字节

javascript - 找出所有可能的组合

python - 将 dict 和 json 传递给 url

python - 如何在扭曲的 SSL 客户端中验证 SSL 服务器证书

python - Google App Engine 上的间歇性 DownloadError 应用程序错误 2

python - 使用新样式类的多重继承时如何确定执行顺序?

python - 将 Pandas DateTimeIndex 转换为 YYYYMMDD 整数?

python - Tensorflow 上的多维 RNN

python - 在 Django ORM 之外编辑数据库

python - TLearn - VocabularyProcessor 忽略部分给定词汇