上一页 1 ··· 53 54 55 56 57 58 59 60 61 ··· 69 下一页
摘要: 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法基本方法总论朴素贝叶斯法是典型的生成学习方法。生成方法由训练数据学习联合概率分布P(X,Y),然后得到后验概率P(Y|X)。即:一)利用训练数据得到P(X|Y)和P(Y)的估计二)根据公式P(X,Y)=P(Y)P(X|Y)得到P(X,Y)三)根... 阅读全文
posted @ 2013-10-20 20:53 jihite 阅读(2743) 评论(0) 推荐(0) 编辑
摘要: 监督学习的任务就是学习一个模型,应用这个模型,对给定的输入预测相应的输出。这个模型一般为决策函数:Y=f(X) 或 条件概率分布:P(Y|X)。监督学习的学习方法可以分为生成方法(generative approach)和判别方法(discriminative approach)。所学到的模型分别叫生成模型和判别模型。生成方法定义由数据学习联合概率分布P(X,Y), 然后由P(Y|X)=求出概率分布P(Y|X)。该方法表示了给定输入X产生输出Y的生成关系。典型模型朴素贝叶斯方法、隐马尔可夫模型特点生成方法可以还原出联合概率分P(X,Y),而判别方法不能;生成方法的学习收敛速度更快,当样本容量增 阅读全文
posted @ 2013-10-20 16:30 jihite 阅读(3804) 评论(0) 推荐(0) 编辑
摘要: ubuntu安装好nltk,调用时,出现问题:解决:Install Setuptools:http://pypi.python.org/pypi/setuptoolsInstall Pip: runsudoeasy_installpipInstall Numpy (optional): runsudopipinstall-UnumpyInstall PyYAML and NLTK: runsudopipinstall-UpyyamlnltkTest installation: runpythonthen typeimportnltk 阅读全文
posted @ 2013-10-18 16:11 jihite 阅读(3319) 评论(0) 推荐(0) 编辑
摘要: 症状Ubuntu 输入正确的密码后,黑屏一闪,重新返回到登陆界面。原因一:主目录下的.Xauthority文件拥有者变成了root,从而以用户登陆的时候无法都取.Xauthority文件。说明:Xauthority,是startx脚本记录文件。Xserver启动时,读文件~/.Xauthority,读入对应其display的记录。当一个需要显示的客户程序启动调用XOpenDisplay()也读这个文 件,并把找到的magic code 发送给Xserver。当Xserver验证这个magic code正确以后,就同意连接啦。观察startx脚本也可以看到,每次startx运行,都在调用xini 阅读全文
posted @ 2013-10-18 15:09 jihite 阅读(58835) 评论(2) 推荐(2) 编辑
摘要: 脚本开头添加默认编码 python源码中出现了中文字符或要处理中文字符,运行时会出现错误,解决方法是,开头加入字符编码声明: 处理时可能会出现问题: UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-15: 阅读全文
posted @ 2013-10-17 21:42 jihite 阅读(1840) 评论(0) 推荐(0) 编辑
摘要: 最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBC)。贝叶斯定理是在250多年前发明的算法,在信息领域内有着无与伦比的地位。贝叶斯分类是一系列分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。朴素贝叶斯算法(Naive Bayesian) 是其中应用最为广泛的分类算法之一。贝叶斯定理描述贝叶斯定理是关于随机事件A和B的条件概率的一则定理。在贝叶斯定理中,每个名词都有约定俗成的名称:P(A)是A的先验概率。之所以称为"先验"是因为它不考虑任何B方面的因素。P(A|B) 阅读全文
posted @ 2013-10-16 14:12 jihite 阅读(4187) 评论(0) 推荐(0) 编辑
摘要: 简介WordNet::Similarity是一个Perl实现的软件包,可以用来计算两个概念(或者word sense)之间的语义相似度,它提供了六种计算相似度和三种计算概念之间关联度的方法,所有的这些方法都是基于WordNet这个词汇数据库。依附WordNetDigest-SHA1WordNet::QueryDataText-Similarity下载位置WordNet:http://wordnet.princeton.edu/wordnet/download/current-version/其他:http://search.cpan.org/安装WordNet1. sudo apt-get i 阅读全文
posted @ 2013-10-15 20:02 jihite 阅读(4288) 评论(1) 推荐(2) 编辑
摘要: 阮一峰老师的博客写的相当详细了,非常佩服,在这里记录一下链接一):自动提取关键词url: http://www.ruanyifeng.com/blog/2013/03/tf-idf.html笔记:分母+1目的是防止所有文档都不包含该词(未登录词)利用tf-idf方法:优点 是简单快速,结果比较符合实际情况。缺点 是这种算法无法体现词的位置信息,出现位置靠前的词与出现位置靠后的词,都被视为重要性相同,这是不正确的。(一种解决方法是,对全文的第一段和每一段的第一句话,给予较大的权重。二):找出相似文章url: http://www.ruanyifeng.com/blog/2013/03/cosin 阅读全文
posted @ 2013-10-12 16:20 jihite 阅读(875) 评论(0) 推荐(0) 编辑
摘要: 作者:阮一峰日期:2013年8月23日网上流传一份查理·芒格(Charlie Thomas Munger)的推荐书单。其中有一本心理学著作《影响力》,芒格是这么说的: "这本了不起的书,解释了我们如何被他人操控,可别犹豫把它推荐给你的朋友。"据说,芒格特别喜欢这本书,还向它的作者罗伯特·西奥迪尼(Robert B.Cialdini)赠送了一股伯克希尔哈撒韦公司的股票(价值10万美元)。因为芒格的推荐,我就去读了这本书。它主要介绍了6种人类的心理行为模式,解释了为什么有些人特别具有说服力,在不知不觉之中就能影响他人。我的总体印象是,这是一本有意思的书,也是 阅读全文
posted @ 2013-10-10 11:16 jihite 阅读(504) 评论(0) 推荐(0) 编辑
摘要: 缘起:《c++ primer》 4th, 528页,习题16.3源程序#include #include #include using namespace std;templateint compare(const S &v1, const S &v2){ if (v1 v2) return 1; else return 0;}int main(){ string s1 = "hi"; string s2 = "world"; cout #include using namespace std;templateint compare... 阅读全文
posted @ 2013-09-25 20:52 jihite 阅读(888) 评论(0) 推荐(0) 编辑
上一页 1 ··· 53 54 55 56 57 58 59 60 61 ··· 69 下一页