我开始在 Python 中使用 CSV 文件,我想学习如何正确操作它们。我想了解如何管理大量数据,例如此处的 CSV 文件 Sacramento Crime January 2006拥有 7,548 条犯罪记录。
基本上,我想将其转换为一个表,其中包含第一行作为标题(名称、ID、纬度等)以及其下的所有其他值。我使用了这个问题which is similar to mine but does not work entirely中的代码。
根据这个问题,我应该有标题的名称及其内容,但我得到:
{'address': [], 'etc': []} []
当我应该得到{{'adress':[]]} ['CSV文件中的地址(7k等)']
当我希望它看起来像这样时,它都在一行中
Name ID Latitude etc
John 55 -4.56777 etc
虽然我所有的 CSV 文件都是这样的:
cdatetime,address,district,beat,grid,crimedescr,ucr_ncic_code,latitude,longitude
1/1/06 0:00,3108 OCCIDENTAL DR,3,3C
目前,我只研究了链接问题的答案中找到的内容,但我已经努力寻找一种方法一段时间了。顺便说一句,我对 Python 还很陌生,因为我刚刚学会了如何打开、读取、写入文件等。
我还应该使用 import pandas
或 import csv
。哪个更好?
最佳答案
我找到了问题的解决方案。比我想象的要简单得多,那就是使用 pandas。我不知道它对于操作 CSV 文件如此有用。
import pandas as pd
path=("path to csv file")
table= pd.read_csv(path, header='infer', sep=',')
print(table)
您可能需要更改分隔符,并且根据您的文件,您可能需要更改 header 的值(0
和 infer
是默认值)。这是以下结果
cdatetime adress district beat etc.
1/1/06 0:00 3108 OCCIDENTAL DR 3 3C etc.
关于python - 如何从 CSV 文件创建 "clean"数据表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43449891/