摘要: 给你一段文字,让你检测它是什么语言?有两个开源的项目可以使用。一个是Apache Tika,一个是language-detection。language-detection是google Code上开源的一个语言检测软件包,不折不扣的日货,但使用起来非常方便,其project链接如下:http://code.google.com/p/language-detection。基本上,你只需要引用langdetect.jar和其依赖的jsonic-1.3.0.jar(也是日货)即可,下面是一个简单的例子。新建一个Java工程,将上述两个jar包引入工程,新建一个测试类,如下:importjava.n 阅读全文
posted @ 2012-09-26 22:27 Bryan Wong 阅读(8543) 评论(2) 推荐(1) 编辑