在linux上centos6安装scws中文分词系统
SCWS是免费开源的中文分词系统,我就是安装了玩玩,本文所有经验取自网络;
原文链接:http://www.xunsearch.com/scws/docs.php#instscws
首先说明一下:
想要在自己的环境里面应用scws分词系统,可分为两个部分;
第一步要安装scws系统;
第二步要添加php的csws扩展;
那么首先安装我把内容简单复制一下:
1. 取得 scws-1.2.3 的代码
cd /
mkdir sc_tmp wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2 2. 解开压缩包 tar xvjf scws-1.2.3.tar.bz2 3. 进入目录执行配置脚本和编译 cd scws-1.2.3
./configure --prefix=/usr/local/scws
make ; make install 注:这里和通用的 GNU 软件安装方式一样,具体选项参数执行 ./configure --help 查看。 常用选项为:--prefix=<scws的安装目录> 4. 顺利的话已经编译并安装成功到 /usr/local/scws 中了,执行下面命令看看文件是否存在 ls -al /usr/local/scws/lib/libscws.la 5. 试试执行 scws-cli 文件 /usr/local/scws/bin/scws -h scws (scws-cli/1.2.3) Simple Chinese Word Segmentation - Command line usage. Copyright (C)2007 by hightman. ... 6 用 wget 下载并解压词典,或从主页下载然后自行解压再将 *.xdb 放入 /usr/local/scws/etc 目录中 cd /usr/local/scws/etc wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2 wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 tar xvjf scws-dict-chs-gbk.tar.bz2 tar xvjf scws-dict-chs-utf8.tar.bz2
完成上面的操作,不出意外的话scws就已经安装到本地服务器了;
那么接下来就是添加php的scws扩展了;
cd /sc_tmp/scws-1.2.3/phpext/
跟安装curl一样,进入到源码目录;
/usr/local/php/bin/phpize;
调用phpize程序生成编译配置文件;
./configure --with-scws=/usr/local/scws --with-php-config=/usr/local/php/bin/php-config
make
make install
配置 编译 安装,完成;
在 php.ini 中加入以下几行 [scws] ; ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空, ; 再把 extension = scws.so 指定绝对路径。 ; extension = scws.so scws.default.charset = gbk scws.default.fpath = /usr/local/scws/etc
然后重启服务器,就可以在info上面看到已经安装了scws扩展了。