我有 sqlite 数据库,需要在其中找到最常用的单词。 例子,
text
table chair floor
table chair
table
需要解决方案
word number
table 3
chair 2
floor 1
数据库很大(几Gb)。我正在寻找 SQL 中的解决方案。也可能使用 C++ 或其他方法。
最佳答案
Sqlite 没有任何允许从单个字符串生成多行的命令(并且不能轻易拥有;这样的事情需要对 SQL 进行“解压”扩展)。所以你需要一个应用程序代码来将评论拆分成单词。你可以创建一个表,在其中将每个单词插入单独的行,然后 select word, count(rowid) from words group by word
,或者你可以直接使用 HashMap 计算单词申请。
关于c++ - sqlite中的文本挖掘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7171954/