我有一个波士顿房价的 txt 文件,我从 UCI 机器学习文件中复制了它,因为数据集不再可用,它看起来像这样:
0.00632 18.00 2.310 0 0.5380 6.5750 65.20 4.0900 1 296.0 15.30 396.90 4.98 24.00
0.02731 0.00 7.070 0 0.4690 6.4210 78.90 4.9671 2 242.0 17.80 396.90 9.14 21.60
0.02729 0.00 7.070 0 0.4690 7.1850 61.10 4.9671 2 242.0 17.80 392.83 4.03 34.70
0.03237 0.00 2.180 0 0.4580 6.9980 45.80 6.0622 3 222.0 18.70 394.63 2.94 33.40
0.06905 0.00 2.180 0 0.4580 7.1470 54.20 6.0622 3 222.0 18.70 396.90 5.33 36.20
0.02985 0.00 2.180 0 0.4580 6.4300 58.70 6.0622 3 222.0 18.70 394.12 5.21 28.70
0.08829 12.50 7.870 0 0.5240 6.0120 66.60 5.5605 5 311.0 15.20 395.60 12.43 22.90
因为没有分隔符选项(制表符、逗号、空格)供我分隔符并将其粘贴到 MS Excel,所以我可以将其 csv 文件,是否有任何简单的代码,以便我可以通过 pandas 或 numpy 快速处理它
最佳答案
我认为需要read_csv
使用 txt
也很好,使用 header=None
来获取新 header to_csv
用于写入文件:
df = pd.read_csv('file.txt', delim_whitespace=True, header=None)
df.to_csv('file1.txt', index=False, header=None)
或者:
df = pd.read_csv('file.txt', sep='\s+', header=None)
df.to_csv('file1.txt', index=False, header=None)
关于python - 使用pandas将txt文件处理为csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49350659/