python - 将数据框保存为 Pandas 中的 csv/文本文件,无需行号

标签 python pandas

我使用 pandas 中的文本文件创建了一个数据框。

df = pd.read_table('inputfile.txt',names=['Line'])

当我做 df

Line
0   17/08/31 13:24:48 INFO spark.SparkContext: Run...
1   17/08/31 13:24:49 INFO spark.SecurityManager: ...
2   17/08/31 13:24:49 INFO spark.SecurityManager: ...
3   17/08/31 13:24:49 INFO spark.SecurityManager: ...
4   17/08/31 13:24:49 INFO util.Utils: Successfull...
5   17/08/31 13:24:49 INFO slf4j.Slf4jLogger: Slf4...
6   17/08/31 13:24:49 INFO Remoting: Starting remo...
7   17/08/31 13:24:50 INFO Remoting: Remoting star...
8   17/08/31 13:24:50 INFO Remoting: Remoting now ...
9   17/08/31 13:24:50 INFO util.Utils: Successfull...   

现在我想将此文件另存为 csv

df.to_csv('outputfile')

我得到的结果是这样的

0,17/08/31 13:24:48 INFO spark.SparkContext: Running Spark version 1.6.0
1,17/08/31 13:24:49 INFO spark.SecurityManager: Changing view acls to: user1
2,17/08/31 13:24:49 INFO spark.SecurityManager: Changing modify acls to: user1
3,17/08/31 13:24:49 INFO spark.SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(user1);
4,17/08/31 13:24:49 INFO util.Utils: Successfully started service 'sparkDriver' on port 17101.
5,17/08/31 13:24:49 INFO slf4j.Slf4jLogger: Slf4jLogger started
6,17/08/31 13:24:49 INFO Remoting: Starting remoting
7,17/08/31 13:24:50 INFO Remoting: Remoting started; listening on addresses :
8,17/08/31 13:24:50 INFO Remoting: Remoting now listens on addresses: 
9,17/08/31 13:24:50 INFO util.Utils: Successfully started service 'sparkDriverActorSystem' on port 100033.

我希望我的输出是

17/08/31 13:24:48 INFO spark.SparkContext: Running Spark version 1.6.0
17/08/31 13:24:49 INFO spark.SecurityManager: Changing view acls to: user1
17/08/31 13:24:49 INFO spark.SecurityManager: Changing modify acls to: user1
17/08/31 13:24:49 INFO spark.SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(user1);
17/08/31 13:24:49 INFO util.Utils: Successfully started service 'sparkDriver' on port 17101.
17/08/31 13:24:49 INFO slf4j.Slf4jLogger: Slf4jLogger started
17/08/31 13:24:49 INFO Remoting: Starting remoting
17/08/31 13:24:50 INFO Remoting: Remoting started; listening on addresses :
17/08/31 13:24:50 INFO Remoting: Remoting now listens on addresses: 
17/08/31 13:24:50 INFO util.Utils: Successfully started service 'sparkDriverActorSystem' on port 100033.

我尝试了以下几种方法,但仍然得到相同的结果,而不是我想要的输出。

np.savetxt(r'np.txt', df.Line, fmt='%d')

df.to_csv(sep=' ', index=False, header=False)

最佳答案

考虑到特殊情况,詹姆斯的回答可能是正确的。 但是,pandas 的标准行为是将行号作为没有标题的列放在前面。 要删除它,只需将 index= 参数设置为 None:

df.to_csv("outfile.csv", index=None)

关于python - 将数据框保存为 Pandas 中的 csv/文本文件,无需行号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46081177/

相关文章:

python - 使用一组字符串对 pandas 系列进行索引会删除该系列中的原始数据

python - Pandas时间序列分类问题

python - Pandas :如何有条件地分配多列?

python - 从几个 numpy 系列创建 Pandas 数据框

Python 快速静态文件服务

python - 如何使用pycharm在远程服务器上的远程docker上设置安全连接

python - 如何使用 Group_Map 使用 Python 3 修复 Spark.SQL 中的 "Cannot use null as map key!"错误

javascript - Flask WTForms 使用多个按钮禁用多个字段

python - 使用 Lambda 将 Pandas 时间转换为小时

python - 在Python中执行多个mapreduce作业