编程浪子Yiutto

2015年12月1日

摘要： The First Class:今天先谈谈AI里面tier-1的conferences, 其实基本上就是AI里面大家比较公认的topconference. 下面同分的按字母序排列.IJCAI (1+): AI最好的综合性会议, 1969年开始, 每两年开一次, 奇数年开. 因为AI实在太大, 所以虽... 阅读全文

posted @ 2015-12-01 19:29 编程浪子Yiutto 阅读(1723) 评论(0) 推荐(0) 编辑

大数据时代的机器学习热点——国际机器学习大会ICML2013参会感想

摘要：摘要：国际机器学习大会（ICML）源于1980年卡内基-梅隆大学举办的机器学习研讨会，如今已发展为国际机器学习学会（IMLS）主办的年度机器学习国际顶级会议，代表机器学习学术界最高水平。大数据时代，ICML又有什么看点？国际机器学习大会（ICML）源于1980年在卡内基-梅隆大学（CMU）举办的机器... 阅读全文

posted @ 2015-12-01 19:09 编程浪子Yiutto 阅读(559) 评论(0) 推荐(0) 编辑

2015年11月26日

SVM（三），支持向量机，线性不可分和核函数

摘要： 3.1 线性不可以分我们之前讨论的情况都是建立在样例线性可分的假设上，当样例线性不可分时，我们可以尝试使用核函数来将特征映射到高维，这样很可能就可分了。然而，映射后我们也不能100%保证可分。那怎么办呢，我们需要将模型进行调整，以保证在不可分的情况下，也能够尽可能地找出分隔超平面。看下面两张图：可以... 阅读全文

posted @ 2015-11-26 11:07 编程浪子Yiutto 阅读(2637) 评论(0) 推荐(0) 编辑

SVM(二）拉格朗日对偶问题

摘要： 2 拉格朗日对偶（Lagrange duality）先抛开上面的二次规划问题，先来看看存在等式约束的极值问题求法，比如下面的最优化问题：目标函数是f(w)，下面是等式约束。通常解法是引入拉格朗日算子，这里使用来表示算子，得到拉格朗日公式为 L是等式约束的个数。然后分别对w和求偏导，使得偏导数等... 阅读全文

posted @ 2015-11-26 10:48 编程浪子Yiutto 阅读(417) 评论(0) 推荐(0) 编辑

SVM(一) 问题的提出

摘要： SVM是支持向量机从诞生至今才10多年，发展史虽短，但其理论研究和算法实现方面却都取得了突破性进展，有力地推动机器学习理论和技术的发展。这一切与支持向量机具有较完备的统计学习理论基础的发展背景是密不可分的。我看了一下网上的帖子和有关的资料，目前关于SVM大约有3到4个版本，但在网上到处都是转载的内容... 阅读全文

posted @ 2015-11-26 10:47 编程浪子Yiutto 阅读(252) 评论(0) 推荐(0) 编辑

2015年11月19日

用R语言对NIPS会议文档进行聚类分析

摘要：一、用R语言建立文档矩阵(这里我选用的是Rx643.2.2)(这里我取的是04年NIPS共计207篇文档做分析，其中文档内容已将开头的作者名和最后的参考文献进行过滤处理)##1.DataImport导入自己下的3084篇NIPStxt文档library("tm")#加载tm包stopwords<-u... 阅读全文

posted @ 2015-11-19 18:58 编程浪子Yiutto 阅读(1489) 评论(0) 推荐(1) 编辑

2015年11月15日

R语言-文本挖掘主题模型文本分类

摘要： ####需要先安装几个R包，如果有这些包，可省略安装包的步骤。#install.packages("Rwordseg")#install.packages("tm");#install.packages("wordcloud");#install.packages("topicmodels")例子中... 阅读全文

posted @ 2015-11-15 21:48 编程浪子Yiutto 阅读(2031) 评论(4) 推荐(0) 编辑

2015年11月9日

R语言做文本挖掘 Part2分词处理

摘要： Part2分词处理在RStudio中安装完相关软件包之后，才能做相关分词处理，请参照Part1部分安装需要软件包。参考文档：玩玩文本挖掘，这篇文章讲用R做文本挖掘很详尽，并且有一些相关资料的下载，值得看看！1. RWordseg功能说明文档可在http://download.csdn.net/det... 阅读全文

posted @ 2015-11-09 13:52 编程浪子Yiutto 阅读(1234) 评论(0) 推荐(0) 编辑

R语言做文本挖掘 Part3文本聚类

摘要： Part3文本聚类分类和聚类算法，都是数据挖掘中最常接触到的算法，分类聚类算法分别有很多种。可以看下下面两篇文章对常见的分类聚类算法的简介：分类算法：http://blog.csdn.net/chl033/article/details/5204220聚类算法：http://blog.chinaun... 阅读全文

posted @ 2015-11-09 13:47 编程浪子Yiutto 阅读(3293) 评论(0) 推荐(0) 编辑

2015年10月28日

浅谈gibbs sampling（LDA实验）

摘要：先把问题描述一下：如果我们已知了topic内的每个词的词频，比如下图中topic1 中money 2 次，loan 3次...那么任意给一个文档我们可以对里面每一个词算一个产生这个词的概率即 P(w=wi|t=tj)如下图，doc1 中的money 百分之百的来自于topic1 。doc2 中的词用... 阅读全文

posted @ 2015-10-28 10:00 编程浪子Yiutto 阅读(383) 评论(0) 推荐(0) 编辑

编程浪子-Yiutto

月落乌啼霜满天，江枫渔火对愁眠

公告