有没有办法让 read_csv
自动检测分隔符? numpy 的 genfromtxt
这样做。
我的文件包含以单空格、双空格和制表符作为分隔符的数据。 genfromtxt()
解决了它,但比 pandas 的 read_csv
慢。
有什么想法吗?
最佳答案
另一种选择是使用内置的 CSV 嗅探器。我将它与只读取一定数量的字节混合起来,以防 CSV 文件很大。
import csv
def get_delimiter(file_path, bytes = 4096):
sniffer = csv.Sniffer()
data = open(file_path, "r").read(bytes)
delimiter = sniffer.sniff(data).delimiter
return delimiter
关于python - 使用 pd.read_csv 自动检测 CSV 文件中的分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46135839/