在centos5下为PHP安装coreseek全文检索引擎支持
coreseek 是在Sphinx 基础上开发的全文检索软件, 具 体介绍详见文尾 附 录 ========================================================= 一、 安装环境及介绍 1. 前提环境 系 统环境:centos5 操 作用户:root 文 中粗体字为需用户输入的命令内容
2. 源码包准备 下 载MMSEG 分词源码包 wget http://www.coreseek.cn/uploads/sources/mmseg3_0b3.tar.gz 下 载coreseek 源码包 wget http://www.coreseek.cn/uploads/sources/csft3_0b4.tar.gz 解 压缩源码包 tar -xzvf mmseg3_0b3.tar.gz tar -xzvf csft3_0b4.tar.gz
3. 安装环境准备 安 装g++ 编译环境 yum install g++ yum install gcc yum install make
安 装python 开发组件 yum install python yum install python-dev
安 装make yum install make
4. 编译mmseg cd mmseg.3.0b3/ ./configure --prefix=/ var / eyou /mmseg make make install
5. 编译coreseek cd csft3_0b4/ ./configure --prefix=/ var / eyou /coreseek --with-python --with-mysql --with-mmseg-includes=/ var / eyou /mmseg/include/mmseg --with-mmseg-libs=/ var / eyou /mmseg/lib/ make & make install
此步安装完成后, 将在/ var / eyou / 下生成 coreseek 目录 coreseek 目录中有三个目录分别为bin 、 etc 、var bin 中 存有sphinx 用到的一些执行文件 包括 indexer 索引建立 search 查询工具 searchd 查询服务器 等 etc 中是配置文 件,该目录中 有一个sphinx.conf. disk ,这个相当于sphinx 的 配置例子文件,我们以这个文件为蓝本,重新创建一个空白内容的sphinx.conf ,存放在 etc 下 。
6. 创建dict 目录 创建字典目录: mkdir /var/eyou/coreseek/dict/ 产生字典步骤: cd /root/soft/ mmseg.3.0b3/data /var/eyou/mmseg/bin/mmseg -u unigram.txt 产生了unigram.txt.uni , 移到相应目录。 cp unigram.txt.uni /var/eyou/coreseek/dict/uni.lib 创建 / var / eyou /coreseek/dict/mmseg.ini 内容: [mmseg] merge_number_and_ascii=1; number_and_ascii_joint=-; compress_space=0; seperate_number_ascii=1; #merge_number_and_ascii: 字母和数字连续出现是非切分 #number_and_ascii_joint: 连接数字和字母可用的符号,如'-' '.' 等 #compress_space :暂时无效 #seperate_number_ascii :是否拆分数字,如 1988 -> 1/x 9/x 8/x 8/x
7. php 调用 sphinx api
通过官方API 调用Sphinx ,具体为: 在 coreseek 安装目录有一个API 目录,里面有三个PHP 文 件:test.php ,test2.php 和sphinxapi.php 。 sphinxapi.php 是sphinx 调用接口封装文件(这个文件就是官方提供的php 调 用API ),test.php 是一个在命令行下执行的查询例子文件,test2.php 是 一个生成摘要的 例子文件。
8. 配置 sphinx.conf 具体参见sphinx.conf 的 注释说明 9. 启动服务
建 立索引 /var/eyou/coreseek/bin/indexer --config /var/eyou/coreseek/etc/sphinx.conf 启 动 searchd 服务 /var/eyou/coreseek/bin/searchd --config /var/eyou/coreseek/etc/sphinx.conf
二、 附录 :全文检索----coreseek
1. 全文搜索与数据库搜索的区别 o 专为全文搜索优化,效率更高 o 支持复杂的查询表达式 o 支持按相关度排序 o 支持中文分词 2. 自建全文搜索与使用Google 等第三方网站提供的站内全文搜索的区别 o 对网站设备有要求 o 索引更新更及时 o 更适应您的网站 o 更有利于您网站的数据整合 o 避免您的访问者遇到某些尴尬 第三方的搜索结果页面不是您可以控制修改的,有推荐一些可能会使您网站访问者尴尬的搜索短语的可能。而使用自建全文搜索则完全无此问题。 (编辑:莱芜站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |