python - 使用 pd.read_csv 自动检测 CSV 文件中的分隔符

标签 python pandas csv delimiter

有没有办法让 read_csv 自动检测分隔符? numpy 的 genfromtxt这样做。

我的文件包含以单空格、双空格和制表符作为分隔符的数据。 genfromtxt() 解决了它,但比 pandas 的 read_csv 慢。

有什么想法吗?

最佳答案

另一种选择是使用内置的 CSV 嗅探器。我将它与只读取一定数量的字节混合起来,以防 CSV 文件很大。

import csv

def get_delimiter(file_path, bytes = 4096):
    sniffer = csv.Sniffer()
    data = open(file_path, "r").read(bytes)
    delimiter = sniffer.sniff(data).delimiter
    return delimiter

关于python - 使用 pd.read_csv 自动检测 CSV 文件中的分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46135839/

相关文章:

python - 每个客户的样本量不同

Python json规范化API请求

python - 将 strip 应用于 DataFrame 中的列表列

matlab - 如何将复杂的 csv 文件导入到 Matlab 中的数值向量

java - 需要帮助在java中将数据写入csv文件

python - 如何选择txt文件中的某个字符串并将其列出在csv文件中?

Python 相当于 dbq?

python - 从jira附件python中获取附件ID

python - 使用 App Engine 正确解析来自 FTP 服务器的 CSV 文件

python - 快速找到所有子集