Sphinx for Chinese with cppJieba
仿照Sphinx for Chinese,基于sphinx 2.2.9版本,结合cppJieba分词系统,让sphinx支持中文。
$ git clone https://github.com/c4ys/sphinx-jieba
$ cd sphinx-jieba
$ git submodule update --init --recursive
$ sudo apt install gcc cmake automake
$ sudo apt install libmysqld-dev
$ ./configure --prefix=/usr/local/sphinx-jieba
--prefix 指定安装路径
--with-mysql 编译mysql支持
--with-pgsql 编译pgsql支持
$ make
$ make install
在索引配置项中添加以下两项:
charset_type = utf-8
chinese_dictionary = /usr/local/sphinx/etc/xdict
注意在source部分一定加上如下字段,否则中文分词无法起作用。
sql_query_pre = SET NAMES utf8
- 在index时,添加同义词功能 a. 本身在Sphinx GetToken时可以返回多个同义Token b. 增加同义词典
- 字典支持二进制形式
- cmake make sure the expat and int64_t varible set.