php - 使用 Sphinx 搜索多个全文字段

标签 php mysql sphinx

我正在尝试使用 sphinxsearch 在多个字段上进行搜索,本质上是为了绕过对搜索过滤属性中使用的数字 ID 的限制(数据库使用大量字母数字 uniqID 作为 ID)。

这是 Sphinx 配置中使用的主要搜索:

sql_query               = \
        SELECT text_page.id, text_page.document_id, documents.startdate, documents.enddate, documents.long_title, documents.volume,text_page.images_page_id, text_page.text, \
        series.name, series.id AS series_id, series.white_label_id AS white_label_id, \
        documents.date_created\
        FROM text_page \
        INNER JOIN documents ON text_page.document_id = documents.id \
        INNER JOIN series ON documents.series_id = series.id

text_page.text 是主要的全文字段。

我已将此行添加到配置中以尝试将此行也全文索引:

sql_field_string = white_label_id

然后我尝试通过 PHP Sphinx 类运行以下查询来创建由 white_label_id 缩小的查询。

"@text (search words) @white_label_id (some-uniq-id)"

据我了解from here ,这应该意味着@text 和@white_label_id 都必须在数据库行上产生命中以返回结果。

但是查询永远不会产生任何结果,也不会产生任何错误或警告。

关于这里出了什么问题有什么建议吗?是因为 white_label_idtext 字段在不同的表上吗?是否有解决方案可以避免重构数据库以使用数字 ID?

编辑:

根据要求,这是一个完整的配置文件。 请注意,目前代码仍在使用 PHP Sphinx 类,而不是通过 mysqli 的 SphinxQL。

source src2
{

    sql_host                = localhost
    sql_user                = username
    sql_pass                = password
    sql_db                  = databasename
    sql_port                = 3306  # optional, default is 3306 
    sql_query_pre           = SET NAMES utf8

    sql_query               = \
        SELECT text_page.id, text_page.document_id, documents.startdate, documents.enddate, documents.long_title, documents.volume,text_page.images_page_id, text_page.text, \
        series.name, series.id AS series_id, series.white_label_id AS white_label_id, \
        documents.date_created\
        FROM text_page \
        INNER JOIN documents ON text_page.document_id = documents.id \
        INNER JOIN series ON documents.series_id = series.id

    
    sql_attr_uint                   = startdate
    sql_attr_uint                   = enddate
    sql_attr_uint                   = volume

    sql_attr_timestamp      = date_created


    sql_attr_string     = long_title
    sql_attr_string     = name
    #sql_attr_string        = white_label_id #NB - does not work with nonnumeric ids
    sql_attr_string     = document_id
    sql_attr_string     = series_id

    sql_field_string = white_label_id  #currently appears to do nothing

    
    sql_ranged_throttle = 0 
}

source src2throttled : src2
{
    sql_ranged_throttle         = 100
}

index myindex11
{
    
    source          = src2
    path            = /var/data/mydata1
    docinfo         = extern
    mlock           = 0
    morphology      = none
    min_word_len        = 1
    charset_type        = utf-8
    html_strip              = 0

}

index myindex1stemmed : myindex1
{
    path            = /var/data/mydata1stemmed
    morphology      = stem_en
    index_exact_words   = 1
}

最佳答案

最终证明有一个更好的解决方案来解决 Sphinx 列 ID 上的“仅限数字”规则。

答案是创建基于文本的 uniq_id 列的数字散列,然后可以用作 sql_attr_uint 来缩小搜索范围。

例如原帖中的SQL查询变为:

sql_query               = \
        SELECT text_page.id, text_page.document_id, documents.startdate, documents.enddate, documents.long_title, documents.volume,text_page.images_page_id, text_page.text, \
        series.name, series.id AS series_id, CRC32(series.white_label_id) AS white_label_id, \
        documents.date_created\
        FROM text_page \
        INNER JOIN documents ON (text_page.document_id = documents.id AND documents.is_active = 1) \
        INNER JOIN series ON documents.series_id = series.id

关于php - 使用 Sphinx 搜索多个全文字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47338787/

相关文章:

mysql - 在 MYSQL 中使用 match 子句进行搜索

php - 如何使用 stackoverflow 等 Google gmail 帐户对用户进行身份验证

php - chrome "net : Failed to load resource: net::ERR_SPDY_PROTOCOL_ERROR"有什么问题?

php - PHP 整数数组索引真的是数字吗?

mysql - 将字符串与查询 MySQL 混合

php - 对于 PDO PHP,将值存储在 var 中安全吗?

mysql - CLSQL 时间戳列类型

mysql - sphinx索引与mysql索引的主要区别是什么,它们允许更快的搜索和聚合

php - PHP 中通过引用传递调用时间的解决方法?

ruby-on-rails - Thinking Sphinx 错误地寻找 mysql 而不是 postgresql