摘要: 手头的语料库依然是msr_training.utf8和msr_test.utf8,它来自于自于SIGHAN Bakeoff 2005的 icwb2-data.rar1.rmspace.cpp研究院的训练文档是已经分好词,但我们并不需要这个结果,我们要使用计算所有分词系统重新进行分词并进行词性标注,所以第一步要把训练文档中行内的空格去掉。#include<iostream>#include<fstream>#include<sstream>#include<string>using namespace std;int main(int argc,c 阅读全文
posted @ 2012-06-28 14:54 高性能golang 阅读(6320) 评论(5) 推荐(0) 编辑