发布于 2014-11-23 23:54:07 | 176 次阅读 | 评论: 0 | 来源: 网友投递
Sphinx 全文检索引擎
Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。
本文为大家讲解的是Sphinx创建全文检索的方法,感兴趣的同学参考下。
Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。
全文检索的索引创建过程一般有以下几步:
1、一些需要创建索引的文档(Documents)。
2、将原文档传给分词组件(Tokenizer)。
3、将得到的词元(Token)传给语言处理组件(Linguistic Processor)。
4、将得到的词(Term)传给索引组件(Indexer)。
Sphinx对索引进行搜索主要分为以下几步:
1、用户输入查询语句。
2、对查询语句进行词法分析,语法分析,及语言处理。
3、搜索索引,得到符合语法树的文档。
4、根据得到的文档和查询语句的相关性,对结果进行排序。
参考: