摘要:
再谈乱码问题,如何解决MYSQL数据中文乱码问题 在之前的文章里,我已经提过如何解决JSP中乱码问题(解决tomcat下中文乱码问题 ),其中也详细解说了MYSQL乱码问题,相信通过里面的办法,肯定都已经解决了JSP里的乱码问题,不过还是有些人的MYSQL乱码问题没有得到解决,包括我自己,所以又找了一些资料,希望这次能完全解决MYSQL数据库的乱码问题。 第一种方法,很精辟的总结:经常更换虚拟主机... 阅读全文
摘要:
还有两门考试,两个大作业……我的研究生课程学习阶段就戛然而止了。目前是考试为重心,大作业程序,可以得过且过的。。 这学期选了五门专业课,每门课都有个project,网络挖掘应用的作业是个pilot paper。到目前形式来看,后面的大作业可能要应付了,毕竟要先以考试为主。我没有选修过统计学习基础之类的课程,但是这学期还特意选了统计的提高课,目的就是通过做大作业强迫自己去学习... 阅读全文
摘要:
注意:本篇博文标红字部分为一处笔误的改正。非常感谢猎兔网开发工程师 罗刚指出错误。欢迎大家光临我的博客指正各种思维不周,本人不拒绝严格的批评,只要能指出具体错误,和改进方案采用这种方法首先要弄懂1.什么是二元语法模型:二元语法模型也就是一阶马尔科夫链,更通俗的说法是:一个词出现与否,仅有它前面一个词有关。举个例子:P(成|结合)*P(结合)>P(合成|结) *P(结)表示 “结合... 阅读全文
摘要:
1. 统计应用案例分析 论文 《产生式模型与判别式模型》要读完2.统计案例分析和自然语言处理大作业合二为一,产生式模型分类器:采用多项式贝叶斯,判别式模型采用 回归分类3. 网络挖掘程序部署到老师的服务器上,借助电脑的高性能将70W数据预处理工作完成建立倒排表。4. 英语听说考试 租房OR买房 资料整理。5. 这周将一些费时间的工作通通干掉,下周及以后复习考试,学习统计推断,以及论文调研。争取网络... 阅读全文
摘要:
(1)语料库格式:为了防止我们作弊,老师对汉字进行了编码,让我们对“加密后”的文本进行分词两个竖线之间的部分对应于一个词。首先介绍 正向最大匹配方法第一步:数据预处理与字典形成:首先语料库转化成一个set格式,set 包含 语料库中出现的全部词形成字典Code highlighting produced by Actipro CodeHighlighter (freewar... 阅读全文
摘要:
想用C++实现一个数学味道很浓的算法,半监督多项式贝叶斯分类算法。觉得自己目前的能力还没有达到这个水平,还是先上Python吧。学C++,STL,可以找些简单的ACM做练笔。 C++处理字符串实在是太麻烦了,有个大牛同学写了个字符转换的类,看完后我吐血了。明天上课让他给讲讲吧。C++还是要学的,但是不能一口气吃成胖子,慢慢来。。。 阅读全文
摘要:
百度空间的第一文,在百度安家了。以后会在上面发一些关于研究问题的见解~。 以前在博客园发表一些文章,但是后来发现,那里更适合讨论技术问题,是技术问题的天堂,所以在百度另开一个空间,和大牛们交流学术见解。从此以后,技术性的的文章备忘发在博客园,学术性的一些拙见放在百度空间。另外百度空间也会记录下自己求学生活的点点滴滴。我的三个主要博客为: (1)学术型博客:http://hi.baidu.com/... 阅读全文
摘要:
Generative modelFrom Wikipedia, the free encyclopediaJump to: navigation, searchIn statistics, a generative model is a model for randomly generating observable data, typically given some hidden parame... 阅读全文
摘要:
遍历字典for m in mydict.iteritems(): print m 阅读全文