调用,封装 ICTCLAS的部分尽量是写成模块的形式,不要封装成函数,否则容易出 access volation 0xx000,或者是

 bSuccess = dll.ICTCLAS_ParagraphProcess(ctypes.c_char_p(s),0)
  segmented=ctypes.c_char_p(bSuccess).value segmented 为None类型的问题。 改成模块调用怎无此问题,不知道为何。

另外ICTCLAS只支持编码格式为gbk的文本分词。其他编码文本如utf-8,应该先转换成gbk。

 

开源软件总是不完备的,因此在使用开源软件时,一定看好说明。

 

 

posted on 2010-08-09 13:43  finallyly  阅读(956)  评论(0编辑  收藏  举报