c++ - sqlite中的文本挖掘

标签 c++ sql sqlite data-mining text-mining

我有 sqlite 数据库,需要在其中找到最常用的单词。 例子,

text
table chair floor
table chair
table

需要解决方案

word number
table  3
chair  2
floor  1

数据库很大(几Gb)。我正在寻找 SQL 中的解决方案。也可能使用 C++ 或其他方法。

最佳答案

Sqlite 没有任何允许从单个字符串生成多行的命令(并且不能轻易拥有;这样的事情需要对 SQL 进行“解压”扩展)。所以你需要一个应用程序代码来将评论拆分成单词。你可以创建一个表,在其中将每个单词插入单独的行,然后 select word, count(rowid) from words group by word,或者你可以直接使用 HashMap 计算单词申请。

关于c++ - sqlite中的文本挖掘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7171954/

相关文章:

sql - 如何在SQl中选择单个表中的所有重复记录

c++ - "mangle"(代表)内存的最佳方式

mysql - MySQL 中出现未知错误

MySQL 使用 WHERE 子句平均分布随机行

mysql - 我无法弄清楚该SQL查询中的错误在哪里

sqlite - SQLite源代码parse.y-nm

c++ - 调用另一个类中的一个类的 friend 成员失败

c++ - C++中的向下转换继承

c++ - 调用 "spin"是什么意思

sql - 从同一表中的逗号分隔列更新行列