python - 使用pandas将txt文件处理为csv

标签 python pandas numpy machine-learning

我有一个波士顿房价的 txt 文件,我从 UCI 机器学习文件中复制了它,因为数据集不再可用,它看起来像这样:

 0.00632  18.00   2.310  0  0.5380  6.5750  65.20  4.0900   1  296.0  15.30 396.90   4.98  24.00
 0.02731   0.00   7.070  0  0.4690  6.4210  78.90  4.9671   2  242.0  17.80 396.90   9.14  21.60
 0.02729   0.00   7.070  0  0.4690  7.1850  61.10  4.9671   2  242.0  17.80 392.83   4.03  34.70
 0.03237   0.00   2.180  0  0.4580  6.9980  45.80  6.0622   3  222.0  18.70 394.63   2.94  33.40
 0.06905   0.00   2.180  0  0.4580  7.1470  54.20  6.0622   3  222.0  18.70 396.90   5.33  36.20
 0.02985   0.00   2.180  0  0.4580  6.4300  58.70  6.0622   3  222.0  18.70 394.12   5.21  28.70
 0.08829  12.50   7.870  0  0.5240  6.0120  66.60  5.5605   5  311.0  15.20 395.60  12.43  22.90

因为没有分隔符选项(制表符、逗号、空格)供我分隔符并将其粘贴到 MS Excel,所以我可以将其 csv 文件,是否有任何简单的代码,以便我可以通过 pandas 或 numpy 快速处理它

最佳答案

我认为需要read_csv使用 txt 也很好,使用 header=None 来获取新 header to_csv用于写入文件:

df = pd.read_csv('file.txt', delim_whitespace=True, header=None)
df.to_csv('file1.txt', index=False, header=None)

或者:

df = pd.read_csv('file.txt', sep='\s+', header=None)
df.to_csv('file1.txt', index=False, header=None)

关于python - 使用pandas将txt文件处理为csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49350659/

相关文章:

python - Tensorflow:将标量张量值作为 int 传递给 set_shape()

python - 在 Selenium 中显示当前光标位置

python - 在 python pandas 中的 groupby 之后填写列中缺少的行

python - Pandas 用 groupby 划分两列

python - 基于连通邻域的 boolean 交集 - NumPy/Python

python - 处理图像时难以 reshape numpy 数组

python - AttributeError: 'Element' 对象没有属性 'findAll'

python - 列表列表的转置

python - 如何在多个条件下填充数据框中新列的值

python - 避免使用多个 if 语句