Hay,我创建了一个蜘蛛来抓取 PDF 文档并将文档中的每个单词记录到 MySQL 数据库的表中。
显然,像“the”、“and”、“or”等词在一本书中出现了很多很多次。
我只是想知道从表中删除重复值的最快方法是什么?
最佳答案
创建一个没有索引单词的表,并使用批量插入将书中的所有单词放入(您也可以使用加载数据)。完成插入后,在 word
字段上添加一个新索引
然后使用以下方法创建第二个表:
CREATE TABLE newTable SELECT DISTINCT word FROM oldTable
关于php - 使 MySQL 表唯一,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1497551/