php - 使用 PHP 创建自然语言搜索引擎

标签 php mysql information-retrieval

我正在尝试用 PHP 编写自然语言解析器和搜索引擎。到目前为止我想到的所有方法要么实现、使用起来很麻烦,要么效率不高。

我的想法之一包括一个可以对简化字符串执行正则表达式的脚本,即。从字符串中删除各种单词,然后首先检查生成的字符串是否有用户正在寻找的内容 - 即“开放时间”,然后如果可能的话,检查他们正在搜索的地点 - 让我们说“Derngate”。其余的类似。

有人能指出我更有效的做事方式吗?如果可以的话,我不想在每个页面加载时执行 25 个不同的正则表达式 - 或者无论计数是多少。

非常感谢!

编辑:我只是好奇,仅此而已。我宁愿自己做(看看它是如何工作的),而不是跳入像 Lucene 这样的东西。

最佳答案

您应该研究一下mapReduce 和并行化:

http://code.google.com/edu/parallel/mapreduce-tutorial.html

我相信谷歌就是这样做的。当然,您没有十亿台计算机来帮助您。

(我还想说,在纯 php 中执行此操作会非常慢)

关于php - 使用 PHP 创建自然语言搜索引擎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5421401/

相关文章:

php - 多个查询字符串中的 SQL MAX()

mysql - 如何在 Yii 中为 ENUM 列实现 CGridView 表的过滤?

machine-learning - 语义搜索,找到可以直观表达的句子

information-retrieval - 余弦相似度和 tf-idf

php - 正则表达式解析 imdb 页面并获取名称

php - SQL计算行数并按顺序显示

Javascript在循环中捕获数据的问题

PHP-修改分页排序

mysql - 如何将多站点数据库从本地主机转移到服务器?

machine-learning - 我是否应该返回更多建议,然后在精确召回曲线中有相关文档?