python - 如何从 CSV 文件创建 "clean"数据表

标签 python csv

我开始在 Python 中使用 CSV 文件,我想学习如何正确操作它们。我想了解如何管理大量数据,例如此处的 CSV 文件 Sacramento Crime January 2006拥有 7,548 条犯罪记录。

基本上,我想将其转换为一个表,其中包含第一行作为标题(名称、ID、纬度等)以及其下的所有其他值。我使用了这个问题which is similar to mine but does not work entirely中的代码。

根据这个问题,我应该有标题的名称及其内容,但我得到:

{'address': [], 'etc': []} []

当我应该得到{{'adress':[]]} ['CSV文件中的地址(7k等)']

当我希望它看起来像这样时,它都在一行中

Name ID Latitude etc
John 55 -4.56777 etc

虽然我所有的 CSV 文件都是这样的:

cdatetime,address,district,beat,grid,crimedescr,ucr_ncic_code,latitude,longitude
1/1/06 0:00,3108 OCCIDENTAL DR,3,3C     

目前,我只研究了链接问题的答案中找到的内容,但我已经努力寻找一种方法一段时间了。顺便说一句,我对 Python 还很陌生,因为我刚刚学会了如何打开、读取、写入文件等。 我还应该使用 import pandasimport csv 。哪个更好?

最佳答案

我找到了问题的解决方案。比我想象的要简单得多,那就是使用 pandas。我不知道它对于操作 CSV 文件如此有用。

import pandas as pd

path=("path to csv file")
table= pd.read_csv(path, header='infer', sep=',')
print(table)

您可能需要更改分隔符,并且根据您的文件,您可能需要更改 header 的值(0infer 是默认值)。这是以下结果

cdatetime           adress        district beat   etc.
1/1/06 0:00    3108 OCCIDENTAL DR      3      3C  etc.

关于python - 如何从 CSV 文件创建 "clean"数据表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43449891/

相关文章:

python - 通过示例了解 LSTM

python - 为什么我的第二个函数没有返回任何内容?

postgresql - pgAdmin4 导入文件错误 - 找不到文件

mysql - 删除双引号内的双引号

python - 无法使用 mark_set 小部件功能移动文本 'insert' 索引(Python 和 Tkinter)

python - PySide 中线程间的通信

python - 如何将 base64 字符串直接解码为二进制音频格式

Python如何替换正则表达式捕获组中的内容?

ruby - 跳过 CSV 的前 5 行

python - 在不阅读的情况下查找 csv 中的行数