上一页 1 ··· 4 5 6 7 8 9 10 11 下一页
摘要: 首先需要安装并加载tm包。1、读取文本x = readLines("222.txt")2、建立语料库 > r=Corpus(VectorSource(x)) > r A corpus with 7012 text documents3、语料库输出,保存到硬盘> writeCorpus(r)4、查看语料库> print(r)A corpus with 7012 text documents> summary(r)A corpus with 7012 text documentsThe metadata consists of 2 tag-valu 阅读全文
posted @ 2012-07-13 10:22 todoit 阅读(2742) 评论(0) 推荐(2) 编辑
摘要: http://www.med66.com/html/ziliao/yixue/19/a4ee9289ed2806758bb2f5a175487c72.htm字段标识符 字段名 解释1 AB Abstract 文摘2 AD Address ,Affiliation 第一作者工作单位、地址3 AID Article Identifier 文章标识符4 ALL All fields 所有字段5 AU , AUTH Author 作者名6 CI Copyright Information 版权信息7 CIN Comment In 对文章的评论参考8 CM Comments 评论9 CN Contrac 阅读全文
posted @ 2012-07-12 11:13 todoit 阅读(6263) 评论(0) 推荐(1) 编辑
摘要: http://bbs.byr.cn/wForum/boardcon.php?bid=298&id=2530&ftype=6原文信息LatentDirichletAllocationDavid.M.BleiAndrew.Y.NgMichael.I.JordanJMLR2003(可google到)原文的主要内容有两种方法设计分类器:1.discriminativemodel,就是由样本直接设计判别函数,例如SVM;2.generativemodel,就是先从样本恢复概率模型——例如我们熟悉的参数方法:混合高斯模型GMM;非参数方法Parzen窗。然后再充分挖掘模型,用以分类。例如B 阅读全文
posted @ 2012-07-11 11:22 todoit 阅读(239) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/hexinuaa/article/details/6021069最近几年来,随着LDA的产生和发展,涌现出了一批搞Topic Model的牛人。我主要关注了下面这位大牛和他的学生:David M. BleiLDA的创始者,04年博士毕业。一篇关于Topic Model的博士论文充分体现其精深的数学概率功底;而其自己实现的LDA又可体现其不俗的编程能力。说人无用,有论文为证:J. Chang and D. Blei.Relational Topic Models for Document Networks.Artificial Intelligence 阅读全文
posted @ 2012-07-11 10:49 todoit 阅读(477) 评论(0) 推荐(0) 编辑
摘要: 作者:南方周末特约撰稿罗敏夏发自:广州最后更新:2012-07-02 09:14:34一位英国的“80后”创业者与一位大学教授联手,通过对推特(Twitter)上每天超过3亿条推文进行抽样,对网民的情绪评分并做成金融模型,以预测证券市场趋势。尽管两个合作者后来分道扬镳,尽管这种预测被一些市场人士批评为“不太靠谱”,但这个年轻人依然在坚持梦想。股市大盘涨跌真的可以预测?英国伦敦有家名为“德温特资本市场”(Derwent Capital Market,简称DCM)的公司宣称掌握了预测金融市场走势的本领,并声称预测成功率达到87.6%。他们的做法是,利用计算机程序,对全球最大的微博客推特(Twitt 阅读全文
posted @ 2012-07-08 22:34 todoit 阅读(1448) 评论(0) 推荐(0) 编辑
摘要: 移动互联网创新大会是持续两天,预计参会人次超过3000人的产业盛会。移动互联网创新大会·开发者日是本次大会的首日活动,“极客公园公开课第一讲”和“红杉资本・创新应用迷你路演”是开发者日的两个分论坛。整个大会将邀请行业领袖进行移动互联网的趋势分享,举办多达6个论坛的深入探讨。http://www.geekpark.net/event/view/details/159746 阅读全文
posted @ 2012-07-08 00:47 todoit 阅读(155) 评论(0) 推荐(0) 编辑
摘要: http://cos.name/category/computing/bayesian/ 阅读全文
posted @ 2012-07-06 15:03 todoit 阅读(256) 评论(0) 推荐(0) 编辑
摘要: http://cos.name/2008/11/how-to-learn-statistics-by-jthu/Posted on2008/11/24by胡江堂选编者谢益辉:很幸运刚好在COS博客开张之际江堂兄送来这篇文章,读完之后觉得写得很棒,于是迫不及待把它放在统计之都新站的开篇位置。江堂兄文字功夫很好,本文统计功夫介绍也很到位。我常认为,入门读物应该由非专业人士来写,这样学习体会才更加深刻,而科班五六年的统计学生,也许反倒深陷其中而不见庐山真面目。个人推荐之处有:(1)手算一次回归(为了了解计算细节并理解公式),大量手算就没有必要了;(2)以有趣的书入门;(3)用简单实用的分析而非刻意追 阅读全文
posted @ 2012-07-06 14:51 todoit 阅读(905) 评论(0) 推荐(0) 编辑
摘要: mysql5.0和myODBC3.5时候,配置用户数据源的时候,测试数据源.会出现下面的错误client does not support authentication protocol requested by server consider upgrading mysql client解决办法就是:在cmd下运行安装mysql目录下bin目录下的mysql.exe -u root -p然后系统提示你输入密码,这个密码是你安装mysql配置时候的root用户的密码.之后进入mysql提示符下输入命令SET PASSWORD FORroot@localhost= OLD_PASSWORD(ne 阅读全文
posted @ 2012-06-28 15:14 todoit 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 如果需要从文件导入数据到数据库,可以用Load data local infile 语句。默认的情况是这样的:制表符tab为字段分隔符,换行符为记录分隔符。这种情况不需要任何附加条件说明,直接用最简明的语句就可以:load data local infile 'F:/pet.txt' into table pet;有的情况是这样的:逗号','为字段分隔符,换行符为记录分隔符。这种情况,只有记录的分隔符是默认的,就要附加字段分隔条件:load data local infile 'F:/pet1.txt' into table pet fields 阅读全文
posted @ 2012-06-13 21:41 todoit 阅读(665) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 下一页