eaglet

本博专注于基于微软技术的搜索相关技术
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

盘古分词 2.3.3.0 -- 改进了批量导入功能

Posted on 2011-06-30 19:28  eaglet  阅读(4732)  评论(30编辑  收藏  举报

V 2.3.3.0 版本改进了批量导入功能

可以批量导入单词,词性和词频了。
输入文件的格式为:
单词|0x00000010|119
子弹|0x00000008|28
文本|0x00000100|2052
其中第一个参数为单词,第二个参数为词性,第三个参数为词频

需要下载代码编译,代码位置:

http://pangusegment.codeplex.com/SourceControl/list/changesets