Python csv 模块与 pandas.read_csv 和 Python xlrd 与 pandas.read_excel

标签 python excel csv pandas

在python中,我们可以使用csv模块或者pandas.read_csv函数来处理csv文件。对于 Excel 文件,我们可以使用 xlrd 模块pandas.read_excel 函数。

我经常使用 pandas,我觉得 read_csv 和 read_excel 函数对我来说派上了用场。 谁能解释一下这些方法的优缺点是什么?

最佳答案

重要提示:xlrd不再支持 .xlsx 文件!

此更改发生在 version 2.0.0

但是关于 CSV 文件,我认为比较 pandascsv 的速度会很有趣。

我的经验是pandas模块读取CSV文件更严格。如果一列全是数字而一行是空的,pandas 会生成一个 NaN 值,除非您使用 df.fillna('', inplace=True) 或类似的东西。如果您有混合数据类型,或者如果您希望列中有 None 或空值,这可能会很烦人。 csv 库似乎可以更好地处理这个问题。

当我在 python2 上使用 csv 时,utf-8 是一个噩梦,但我认为现在使用 python3 会更好。

关于Python csv 模块与 pandas.read_csv 和 Python xlrd 与 pandas.read_excel,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44317615/

相关文章:

c# - 在现有工作簿中存储 Excel 加载项

java - 在java中检查文件类型(csv或excel文件(xlsx))

javascript - 如何将复选框值导出到 csv 文件?

更新步骤后的python for循环?

python - 图例中的 Pandas groupby 对象

python - 如何在 Azure Web 应用程序上运行 apt-get 或在 azure 上的 Flask 中导入 cv2?

php - 为 python 中的参数化查询生成变量长度放置持有符字符串

php - 导入 utf-8 标题 Maatwebsite Laravel

sql - 循环有条件导出表 SAS(大量变量)

java正则表达式删除csv中不需要的双引号