摘要: publicclassCRFClassifier<INextendsCoreMap>extendsAbstractSequenceClassifier<IN>使用CRF模型进行层序划分的类。这个类具有处理不同格式文档的功能,但是当使用标准ColumnDocumentReaderAndWriter类用来训练或者测试模型时,输入文件中要一行一个token(几列标志性的东西,比如单词、POS、chunk和answerclass)。ColumnDocumentReaderAndWriter默认训练集是有3列输入的,分别是:单词、pos、goldclass,但是这个可以通过map 阅读全文
posted @ 2012-11-29 11:39 ZH奶酪 阅读(4016) 评论(0) 推荐(0) 编辑