Mousika

天地孤影任我行

导航

2012年3月6日 #

paoding庖丁分词使用小例子(学习笔记)

摘要: 做SRT遇到要分词,以前做了一个分词系统,但那个是老师提供的词库,真要自己来做分词,没词库怎么行?到处找词库,找不到好用的,后来还在台湾某个学术机构上看到一个词库,但要台币一万大洋,郁闷~~没办法,最后想到直接找开源的分词软件,找到庖丁,于是大呼“爽”!下面直接给一个小例子,功能是将某个目录下的某个txt文件里面的内容读取出来并分词,把分词结果显示出来:先配置好paoding的运行环境,无非就是把庖丁用的那些jar文件导入项目。然后需要导入包:import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.F 阅读全文

posted @ 2012-03-06 13:20 lujian863 阅读(693) 评论(0) 推荐(1) 编辑