摘要: 机器学习和计算机视觉都是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个researcher来说,往往是非常exciting的enjoyable的事情。不过,这也代表着要充分了解这个领域并且取得有意义的进展是很艰苦的。Linear Algebra (线性代数) 和 Statistics (统计... 阅读全文
posted @ 2014-05-11 10:34 亲爱的扣扣 阅读(415) 评论(0) 推荐(0) 编辑
摘要: 为什么会出现勒贝格积分这个问题等价于勒贝格积分和黎曼积分有什么区别。其实这个区别没有那么玄,反而很好解释。问题的根源在于黎曼积分的定义上。黎曼积分:.黎曼积分是在轴上做的分割,虽然可以分割得很细,但只要被积函数在这个分割区间上的上界和下界的差不能被控制到很小时就有可能使得分割和不唯一。换言之,此时这... 阅读全文
posted @ 2014-05-11 10:33 亲爱的扣扣 阅读(14636) 评论(1) 推荐(0) 编辑
摘要: 线性代数主要讲矩阵,矩阵就是线性变换,也就是把直线变成直线的几何变换,包括过原点的旋转、镜射、伸缩、推移及其组合。特征向量是对一个线性变换很特殊的向量:只有他们在此变换下可保持方向不变,而对应的特征值就是该向量缩放的比例。最大特征值和对应的特征向量就意味着在该方向上方向不变且缩放比例能达到最大。注意... 阅读全文
posted @ 2014-04-20 20:08 亲爱的扣扣 阅读(3857) 评论(0) 推荐(0) 编辑
摘要: 今天早上屁颠屁颠地跑去听了徐宗本院士的:关于大数据研究的若个问题 觉得还不错,由于徐教授横跨数学与管理两方面,所以讲的角度还有深度刚刚好在我的接受范围内。讲座主要从下面三个方面来讲的:1 关于大数据的认识2 大数据研究涉及的科学问题3 他们团队的探索(一)关于大数据的认识大数据炒得很火,但是什么是大数据,跟海量数据有什么区别? 徐教授首先从自己的角度给出大数据的定义,主要有四个特点:a 不能在单个计算机上集中存储,一般需要用到分布式/云计算模式等;b 难以在可接受的时间内进行分析处理;c 单个数据可能价值不大,但是数据整体还是有高价值的(比如一个班级大家发的微博可能没有特别大的意义,但是全国高 阅读全文
posted @ 2013-12-04 12:04 亲爱的扣扣 阅读(4968) 评论(0) 推荐(0) 编辑
摘要: 准备系统性地整理一下数据挖掘&机器学习常见方法,温故而知新,less is more。先列一下初步目录:(每个冒号后面是主要的focus)1 关联规则挖掘:Apriori 算法& FP-tree2 贝叶斯方法:朴素贝叶斯&贝叶斯网络3 组合提升:Boosting&Adaboost,随机森林4 决策树系列:ID3,C4.5 &MART(又叫GBDT(GradientBoostingDecisionTree))5 主题模型:LDA&PLSA6 聚类算法,包括混合高斯模型7 回归分析,包括logistic,regularlization8 EM9 SV 阅读全文
posted @ 2013-11-09 18:02 亲爱的扣扣 阅读(428) 评论(0) 推荐(0) 编辑
摘要: 主题:简介课程,渐近概念的大局观,插入排序和归并排序,递归式函数时间分析(递归树方法)教材:《算法导论》收获:很感动地看到算法分析那个log(n)是为什么出现了,更深层还要听第二讲,若不是因为要准备SAS,恨不得马上看。内容:1 何为算法分析? 计算机程序运行性能和存储空间的理论分析,叫算法分析。也就是关注2点:1 性能,就是程序跑得快不快; 2 存储空间,即占用了多大的内存。但是主要还是关注性能。(可能是因为时间就是金钱吧,而且现在计算机硬件发展速度还不错)2 比性能更加重要的因素都有哪些?比如成本,正确性,功能特征(features),用户用好,模块化性等等。3 那为何还学习算法和性能?很 阅读全文
posted @ 2013-10-05 22:15 亲爱的扣扣 阅读(5512) 评论(8) 推荐(2) 编辑
该文被密码保护。 阅读全文
posted @ 2013-08-30 20:12 亲爱的扣扣 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 这三个名词在机器学习领域的文章中极其常见,但很多人对他们的概念并不是特别清楚,尤其是后两个经常被人混用。Ripley, B.D(1996)在他的经典专著Pattern Recognition and Neural Networks中给出了这三个词的定义。 Training set: A set of examples used for learning, which is to fit the parameters [i.e., weights] of the classifier. Validation set: A set of examples used to tune the para 阅读全文
posted @ 2013-07-28 17:21 亲爱的扣扣 阅读(5421) 评论(0) 推荐(0) 编辑
摘要: 最近媒体网络,校园,书籍文献到处都充斥着“大数据”“云”“超级计算”,大数据时代在我们没有意识到的时候就静悄悄地走近了我们,谷歌,阿里巴巴,搜狗一系列的公司摩拳擦掌,准备在大数据时代大干一场。维克托的《大数据时代》在留在畅销书籍榜好久了。 那么什么是大数据时代呢?之前一直以为大数据时代是因为数据量变得越来越大,普通PC根本无法支撑,所以有了超级计算,hadoop,大数据。看了这期的《对话》节目,才开始理解,其实大数据时代,用谢文的话说,可以“看做是一种世界观,看做一种现在世界上的万事万物都被数据化,在我们星球的上空有一个和我们相对应的数据地球,这个星球正在形成,我们要注意他,利用他”。维克托. 阅读全文
posted @ 2013-04-18 18:57 亲爱的扣扣 阅读(3053) 评论(3) 推荐(3) 编辑
该文被密码保护。 阅读全文
posted @ 2013-01-01 22:10 亲爱的扣扣 阅读(1) 评论(0) 推荐(0) 编辑