摘要:
1.7 ICTCLAS_GetParagraphProcessAWordCountGet ProcessAWordCount, API for C#int ICTCLAS_GetParagraphProcessAWordCount(const char *sParagraph);RoutineRequired HeaderICTCLAS_FileProcess<ICTCLAS30.h>... 阅读全文
2010年6月8日
摘要:
1.7ICTCLAS_GetParagraphProcessAWordCountGet ProcessAWordCount, API for C#int ICTCLAS_GetParagraphProcessAWordCount(const char *sParagraph);RoutineRequired HeaderICTCLAS_FileProcess<ICTCLAS30.h>R... 阅读全文
摘要:
SharpICTCLAS虽说是开源的,但07年以后就没有人再进行维护,跑搜狗的语料问题不少,就连C#版本的作者也承认有不少问题。想得到更为准确的分词结果,还是研究SharpICTCLAS3.0,也就是ICTCLAS 2009版。dll 文件不是C#开发的,所以引入要通过DllImport先自己写了个类代码 Code highlighting produced by Actipro CodeHigh... 阅读全文
2010年6月7日
摘要:
实习的时候师傅给写的一个示例[代码] 阅读全文
摘要:
在看C#的SharpICTCLAS,wordResult是一个类,总感觉怪怪的,自己写了个小类测试一下。代码如下:[代码]也没什么需要解释得了。 阅读全文
2010年5月31日
摘要:
最近在看贝叶斯算法,该算法在不少方面都有应用,已有的开发实例有:拼写检查、文本分类、垃圾邮件过滤、中文分词等方面。根据需要,决定实现前面两种,拼写检查已经实现,先贴于此。程序效果图:有关贝叶斯算法的学习和拼写纠正方面请参照:原文这里,徐宥的翻译版这里。程序流程:1.根据训练语料统计训练语料中每个单词的出现次数、频率,计算出p(h)先验概率;训练语料在此下载big.txt,内含几百万单词,可作为语料... 阅读全文
2010年5月3日
摘要:
赤兔之死,调查地沟油的那个记者叫蒋昕捷,就是当年那个写出高考满分作文《赤兔之死》的那位,这是我见过的最有出息,最有社会责任感的高考状元。蒋昕捷 2005年7月从南京师范大学毕业后,进入中国青年报工作,做过3年教育新闻报道,现为冰点特稿部记者。学的是广播电视新闻,干的文字记者的活儿,希望能用笔去代替摄像机还原现场,带给读者最真实的故事和声音。-----------------------------... 阅读全文
摘要:
【研究生】毕业答辩PPT制作和讲述要点(整理) 原文链接:http://www.sciencenet.cn/m/user_content.aspx?id=232974(吴渝老师)引言:在QQ群上和研三的点评答辩ppt制作结果,不知不觉“唠叨”了很多。其中,让大家共享一下彼此的ppt文档,取人所长。不想,学生杨涛有心整理了一个文档给我,一看,都是我唠叨下来的片段组合。他大概误... 阅读全文