为简单起见,我打算存储一些由最终用户创建的基于 html 的内容。所以像下面这样的表格
create table Content
(
ContentId,
Title,
ContentHtml
)
现在,假设 HTML 来自 CKEditor。还存储纯文本版本的内容是否是一种好习惯,以便全文搜索或任何搜索机制可以更轻松地找到内容?如下图。
table Content
(
ContentId,
Title,
ContentHtml,
ContentPlainText
)
最佳答案
正如评论中所指出的:绝对!有一些格式字符串和 HTML 标记不属于任何可以想象的搜索(除非您正在寻找特定的格式,例如,有人使用 AliceBlue
)。
此外,如果您不输入像 HTML 标签名称这样的“垃圾”,您的索引可能会更有效率,加快搜索速度。
关于sql - 存储纯文本(除 HTML 数据外)是否有利于提高可搜索性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14251689/