您当前的位置:首页 > coreseek-4.1-beta 安装 mmseg sphinx网站首页日记


正文阅读

coreseek-4.1-beta 安装 mmseg sphinx

发布时间:2014-5-24 15:55 Saturday编辑:张立荣

    Coreseek 安装

    1)依赖包安装顺序
       m4、autoconf、automake、libtool  yum或通过rpm 进行安装

    2)进入到Coreseek目录下 分别安装 coreseek  mmseg

       LibMMSeg是为Sphinx全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。LibMMSeg在本文中用来生成中文分词词库。

    coreseek-4.0.1-beta.tar.gz里面包含下面几个目录
    csft-4.0.1   ----- coreseek源代码
    mmseg-3.2.14 ----- mmseg源代码
    testpack     ----- 测试配置和数据包
    README.txt   ----- 查看解压缩出来的目录结构
     
    =================================================================================================
    =================================================================================================
    =================================================================================================
    =================================================================================================


    http://blog.sina.com.cn/phpsir
    coreseek-4.1自带的mysqlse为r2917,支持string属性字段。


    $tar -zxpf  coreseek-4.1-beta.tar.gz

    1.安装mmseg

      $cd mmseg-3.2.14
      $./configure --prefix=/usr/local/mmseg
      如果出现如下错误:
      config.status: error: cannot find input file: src/Makefile.in
      运行:
      $aclocal
      $libtoolize --force
      $automake --add-missing
      $autoconf
      $autoheader
      $make clean
      在重新config
      $./configure --prefix=/usr/local/mmseg
      打印如下信息说明config成功
      ------------------------------------------------------------------------
      Configuration:

        Source code location:       .
        Compiler:                   gcc
        Compiler flags:             -g -O2
        Host System Type:           x86_64-unknown-linux-gnu
        Install path:               /usr/local/mmseg

        See config.h for further configuration information.
      ------------------------------------------------------------------------
      编译:
      $ make
      $ make install

    2.安装csft(sphinx)

      $cd ../csft-4.1/
      $sh buildconf.sh
      $./configure --prefix=/usr/local/coreseek --without-python --with-mysql=/usr/local/mysql --with-mmseg=/usr/local/mmseg  --with-mmseg-includes=/usr/local/mmseg/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg/lib/

      $make
      $make install

    3.配置...
      $cd /usr/local/mmseg/etc
      $ ../bin/mmseg -u unigram.txt
      生成unigram.txt.uni

      $ mv unigram.txt.uni uni.lib

      $cd ../../coreseek/etc
      $cp sphinx.conf.dist sphinx.conf
      $ln -s sphinx.conf csft.conf
      $vi sphinx.conf
      查找index_exact_words,在它下面加一行
      charset_dictpath        = /usr/local/mmseg/etc/


    4、安装sphinx扩展
     
       #tar xvzf sphinx-1.3.0.tgz
       #cd sphinx-1.3.0.tgz
       #/usr/local/php/bin/phpize
       #./configure --with-php-config=/usr/local/php/bin/php-config --with-sphinx=/usr/local/libsphinxclient
       #sudo make && make install

       修改php.ini
       extension_dir = "/usr/local/php/lib/php/extensions/no-debug-non-zts-20100525/"
       [sphinx]
       extension=sphinx.so

       注意,
          如果出现错误:“configure: error: Cannot find libsphinxclient headers”
          解决方法:
            cd coreseek-4.1/csft-4.1/api/libsphinxclient/
            ./configure --prefix=/usr/local/libsphinxclient
            sudo make && make install

    如果你是升级安装请务必要重新生成索引文件。
    =================================================================================================
    =================================================================================================
    =================================================================================================
    =================================================================================================

    #启动coreseek
    /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf

    #创建
    /usr/local/coreseek/bin/indexer --rotate --all

    /usr/local/coreseek/bin/indexer main --rotate >>/usr/local/coreseek/var/log/merge.log

    /usr/local/coreseek/bin/indexer delta --rotate >>/usr/local/coreseek/var/log/delta.log


    #停止coreseek
    /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf --stop

    =================================================================================================
    =================================================================================================
    =================================================================================================
    =================================================================================================

    配置文档:
    1、cd /usr/local/coreseek/etc
      进入配置目录通过命令ls可以看到3个文件
      example.sql  sphinx.conf.dist  sphinx-min.conf.dist
      其中example.sql是示例sql脚本我们将其导入到数据库中的test数据库中作为测试数据(会创建两张表 documents和tags)

    2、vi sphinx.conf

    3、生成索引
      /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all

关键字词:标签: linux

评论:

365bet官网
2016-09-20 15:25
博客模板挺漂亮的,用的Zblog吧?Zblog开始挺快,数据大了就慢了,趁着没有做大早打算
张立荣
2016-09-20 21:13
@365bet官网:不是,谢谢

发表评论:

您也可以直接填写QQ到下面的输入框中,点击获取用户资料实现自动调用您的QQ资料