马丁传奇

导航

上一页 1 ··· 3 4 5 6 7

2013年7月24日 #

SCWS中文分词,向xdb词库添加新词

摘要: SCWS是个不错的中文分词解决方案,词库也是hightman个人制作,总不免有些不尽如人意的地方。有些词语可能不会及时被收入词库中。 幸好SCWS提供了词库XDB导出导入词库的工具(phptool_for_scws_xdb.zip),下载后解压至任意文件夹,我解压至“E:/www/tools/scws_xdb/”目录下。在命令行下进入PHP的安装目录,我的目录是”E:/xampp/php“。 步骤1:执行命令行,将词库先导出来,生成一个文本文件(dict.txt): 命令格式为:php dump_xdb_file.php [要存入的文本文件] 几秒后在E:/scws目录下我... 阅读全文

posted @ 2013-07-24 00:16 马丁传奇 阅读(1530) 评论(0) 推荐(0) 编辑

SCWS中文分词,词典词性标注详解

摘要: SCWS中文分词词典条目多达26万条之巨,在整理的时候已经把很多明显不对的标注或词条清理了---- 附北大词性标注版本 ----Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。 a 形容词 取英语形容词adjective的第1个字母。 ad 副形词 直接作状语的形容词。形容词代码a和副词代码d并在一起。 an 名形词 具有名词功能的形容词。形容词代码a和名词代码n并在一起。 b 区别词 取汉字“别”的声母。 c 连词 取英语连词conjunction的第1个字母。 Dg 副语素 副词性语素。副词代码为d,语素代码g前面置以D。 d 副词 取adverb的第2个字母,因其第1个 阅读全文

posted @ 2013-07-24 00:02 马丁传奇 阅读(1740) 评论(0) 推荐(0) 编辑

2013年7月23日 #

SCWS中文分词,demo演示

摘要: 上文已经讲了关于SCSW中文分词的安装配置,本节进入demo演示:';//////////////////////////////////////////////////////////////////////////////echo $text="我是一个中国人,我会C++语言,我也有很多T恤衣服,我想知道奥迪A6与第八代索纳塔哪个油耗低,谢谢花好月圆二手奥拓芽菜好吃悦翔V3怎么样卧槽日系车Q5";echo '';$so = scws_new(); //创建并返回一个 `SimpleCWS` 类操作对象$so->set_charset( 阅读全文

posted @ 2013-07-23 23:57 马丁传奇 阅读(1168) 评论(0) 推荐(0) 编辑

SCWS中文分词,安装说明(以:Win32环境、utf8字符集为例)

摘要: SCWS官方网站:http://www.xunsearch.com/scws/1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。 目前支持 PHP-5.2.x 和 PHP-5.3.x 系列,下载地址分别为: php-5.2.x(44KB/VC6/ZTS): http://www.xunsearch.com/scws/down/php-5.2.x/php_scws.dll php-5.3.x(44KB/VC6/ZTS): http://www.xunsearch.com/scws/down/php-5.3.x_vc6/php_scws.dll 将下载后的 阅读全文

posted @ 2013-07-23 23:36 马丁传奇 阅读(1142) 评论(0) 推荐(0) 编辑

PHP关于VC9和VC6以及Thread Safe和Non Thread Safe版本选择的问题

摘要: 一、如何选择PHP5.3的VC9版本和VC6版本 VC6版本是使用Visual Studio 6编译器编译的,如果你的PHP是用Apache来架设的,那你就选择VC6版本。 VC9版本是使用Visual Studio 2008编译器编译的,如果你的PHP是用IIS来架设的,那你就选择VC9版本。二、如何选择PHP5.3的Thread Safe和None Thread Safe版本 Windows版的PHP从版本5.2.1开始有Thread Safe(线程安全)和None Thread Safe(NTS,非线程安全)之分,这两者不同在于何处?到底应该用哪种?这里做一个简单的介绍。 从200... 阅读全文

posted @ 2013-07-23 22:15 马丁传奇 阅读(254) 评论(0) 推荐(0) 编辑

上一页 1 ··· 3 4 5 6 7