在python中,我们可以使用csv模块
或者pandas.read_csv
函数来处理csv文件。对于 Excel 文件,我们可以使用 xlrd 模块
或 pandas.read_excel
函数。
我经常使用 pandas,我觉得 read_csv 和 read_excel 函数对我来说派上了用场。 谁能解释一下这些方法的优缺点是什么?
最佳答案
重要提示:xlrd不再支持 .xlsx
文件!
此更改发生在 version 2.0.0
但是关于 CSV 文件,我认为比较 pandas
和 csv
的速度会很有趣。
我的经验是pandas
模块读取CSV文件更严格。如果一列全是数字而一行是空的,pandas
会生成一个 NaN
值,除非您使用 df.fillna('', inplace=True)
或类似的东西。如果您有混合数据类型,或者如果您希望列中有 None
或空值,这可能会很烦人。 csv
库似乎可以更好地处理这个问题。
当我在 python2 上使用 csv
时,utf-8
是一个噩梦,但我认为现在使用 python3 会更好。
关于Python csv 模块与 pandas.read_csv 和 Python xlrd 与 pandas.read_excel,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44317615/