python - 如何索引CSV文件以高效搜索?

标签 python csv search dictionary search-engine

我有一个包含超过 40 万行和大约 20 列的 CSV 文件,因此当我查找特定值时,搜索 CSV 文件需要花费太多时间。我想知道如何映射文件,以便高效快速地搜索某个值。

提前致谢!我很乐意回答任何问题!

最佳答案

假设您可以将所有内容存储在 RAM 中(即加载它),我会使用 pandas。

import pandas as pd
csv_loc = 'C:/yourcsv.csv'
df = pd.read_csv(csv_loc, sep=',', header=0) #http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html
df['name'] # would select a column called name
# This would show observations which start with STARBUC
match = df['name'].str.contains('(^STARBUC)')
print(df['name'][match].value_counts())

等等。 This is a great tutorial and this

关于python - 如何索引CSV文件以高效搜索?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35759692/

相关文章:

javascript - 根据 CSV 值切换可见性

java - 如何转义csv文件中String[]数组中的逗号?

python - CSV 上传时未设置外键 -- Django

在二维网格上寻找发电站的算法

python - 如何根据唯一列组合 Pandas 数据框

python - 检查 pandas 数据框中相邻行的值以进行库存回测的更有效方法

python - 在 WXPYTHON 面板中定位 matplotlib 图形时遇到问题

python - Pyramid 网络框架 hello world 不工作

php - 从数据库中搜索部分单词

javascript - JS : . search() 空格和括号中的正则表达式