这里有人有编写自定义 FTS3(全文搜索扩展)分词器的经验吗?我正在寻找一个会忽略 HTML 标签的分词器。
谢谢。
最佳答案
我没有直接经验,但通过使用“sqlite3 registerTokenizer”进行网络搜索,我发现了两个可以用作基础的分词器:a snowball tokenizer和 a MeCab tokenizer .
关于html - sqlite-fts3 : custom tokenizer?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3657964/