python-3.x - 在两个巨大的数据集中找到相同的值

标签 python-3.x algorithm list search bigdata

我有一个大约有 2000 行的列表 [UnixTimestamp, Value01, Value02](它以 JSON 形式出现),我有另一个列表有几百万行 [UnixTimestamp, Value01, Value02](它以 . csv) 我想弄清楚较小列表中的每个元素是否在第二个列表中具有相同值的元素。 两个列表都按时间戳排序

最简单的方法显然是这样的:

for x in small_List:
    if x in big_list:
        return True
    return False

但这是否有意义,或者是否有更有效的方法?

谢谢

最佳答案

如果它们只是列表,您可以尝试这样的操作。

设置(小列表)和设置(大列表)

转换为 set 将删除重复值,您可以使用 & 运算符比较并返回两个集合的相同值。

关于python-3.x - 在两个巨大的数据集中找到相同的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53322280/

相关文章:

windows - 如何通过资源管理器删除Python文件

python - N gram NLP 到 Excel 文件

python-3.x - smtplib, 'tuple' 对象没有属性 'encode'

java - 如何从排序列表中获取第一个元素?

python - 无法使用我的 scraper 中定义的 xpath 获取项目

algorithm - 盲图像反卷积

algorithm - 贪心算法如下

algorithm - 高效的子集枚举

python - 将列表中的每个数字四舍五入到另一个列表中最接近的数字

python - 如何从自定义对象列表中删除重复项?