python - MySQL存储和搜索文本

标签 python mysql elasticsearch

假设我们每个都有一页的3M文件。我想将所有文本导入MySQL数据库。对于我正在阅读的内容,我可以将其添加为文本字段(65535个字符)。
我面临的挑战是,我们每天收到的文件与我们拥有的3M文件之一略有相同。当输入文本不相同时,有没有一种方法或结构可以在MySQL文本中搜索文本块?我需要知道我们是否有一个或多个文档与收到的文档非常匹配。在理想的世界中,我希望得到一个与搜索文本更匹配的结果...
这样做的结果机制可能包括MySQL和Python作为解决方案。我在任何地方都找不到最好的方法来做到这一点,而且搜索不需要花费很多时间。
[Edited 2020-09-29]
从我目前发现的情况来看,对于此类问题,似乎可以使用sabik指出的Elasticsearch作为一个好的方向。

最佳答案

前一段时间,我尝试使用MySQL做类似的事情,然后发现SQL SERVER FILESTREAM。
我将文档保存在二进制类型varbinary(max)的字段中,该字段占用更少的空间,并且搜索速度非常快。
也许现在您可以看到MySQL是否具有类似于FILESTREAM的功能,但我最近尚未对其进行研究。

关于python - MySQL存储和搜索文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64112212/

相关文章:

Python 查找两个字典是否具有相同的按值划分的键

elasticsearch - Elasticsearch 5.2.2 Raspberry Pi 3低CPU内存优化

spring - Spring数据 Elasticsearch 映射

elasticsearch - 我可以通过ElasticSearch Bulk Api中的查询进行更新吗?

python - 如何从大文件中读取行分隔的 JSON(逐行)

python - 当前实现中如何避免索引超出范围错误?

python - 类型错误 : Field 'id' expected a number but got (()

php - 无法执行更新功能。我认为我的 $id 赋值有问题

PHP mysqli_query 花费的时间太长

php - 从单选按钮输入到 php,然后添加到数据库