上一页 1 2 3 4 5 6 ··· 8 下一页
摘要: 每次我想看电影的时候,都会去问我的朋友,小健。一般他推荐的电影,我都比较喜欢。显然不是所有人都有小健这样的能力。因为我碰巧和小健有类似的品味。 这个生活中的经验,实际上有着广泛的用途。 当系统需要为某个人做出推荐时,一种机器学习的算法是这样工作的:就是在一大群人中找出一部分与他品味类似的人,把这些人的喜欢的东西排序,然后推荐给他。 自然引出两个问题: 谁是与他相近品味的人; 怎么对这些人喜欢的东... 阅读全文
posted @ 2016-04-07 23:37 永远是学生 阅读(661) 评论(0) 推荐(0) 编辑
摘要: Technorati 标签: 架构图,架构,交流,布局 不知不觉中做架构师也已经4年了,最初的感觉只是一个名号,不再把代码作为强制的任务,后来开始慢慢的转变工作内容。画图,成为了我的主要工作。我可能不是每天都在写代码,但却是每天都在画图,而且我越来越觉得画图让我更容易说清楚。 画架构图有几个好处:看清楚系统包含哪几个部分,各个部分实现什么职责,相互之间的关系是什么。当和别人讨论的时候,通过架构图可... 阅读全文
posted @ 2016-04-06 23:26 永远是学生 阅读(5749) 评论(0) 推荐(0) 编辑
摘要: 拜访者模式(visitor)适用于对复杂结构体进行解析的场景。 所谓复杂结构体,是指包含多个子元素的对象,比如集合,树,图,或者组合对象……。结构体中的每个元素,包括结构体本身实现接口: Element{ //element的信息属性,在此省略 //专门用于调用visitor的方法 void accept(visitor) } 所谓解析,是指提取结构体中各个元素的相关信息,组合起来。解析器实现接口... 阅读全文
posted @ 2016-04-01 22:15 永远是学生 阅读(933) 评论(0) 推荐(0) 编辑
摘要: 首先你需要安装httplib2,这个可以在github上找到; 然后你需要获得一个http连接的对象:con = httplib2.Http() 然后你需要发起连接:(6)resp, (5)content = con.request( (1)BAIDU_COM_API_COMMENTS, (2)method="POST", body=(3)body,headers=(4)header_data)参... 阅读全文
posted @ 2016-03-30 23:17 永远是学生 阅读(2601) 评论(0) 推荐(0) 编辑
摘要: 决策树是一种新算法: 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。 决策树算法可用于数据类型:数值型和标称型。 决策树的核心在于选择正确的属性对数据进行划分。选择的标准是数据增益。信息增益:讲无序的数据变得更加有序。 信息增益熵:如果把X分成n个类,每个类的概率为p(i),那么-log(p(i))的期望就是熵。 如果分成... 阅读全文
posted @ 2016-03-29 23:06 永远是学生 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 本书中的这个聚类算法多少有些让人意外。通常的聚类算法是这样的: 给定一堆点; 给定一个距离计算的算法; 给定一个cluster之间的距离d,或者最小的cluster数目k; 初始化,每个点作为初始集群的中心; 循环直到cluster个数小于K,或者任意两个cluster的距离大于d; 计算每个点i到每个中心点j之间的距离,Dij; 将绝对值最小的节点 i 汇总到cluster j中; 重新计算... 阅读全文
posted @ 2016-03-27 22:26 永远是学生 阅读(1022) 评论(0) 推荐(0) 编辑
摘要: 随机变量之间的存在映射关系。假如现实中随机变量X的概率分布很复杂,不容易看清楚,但是如果对X取一个函数,就会比较简单;那么我们可以定义Y=g(x),的随机变量。有几个定理来描述Fx和Fy之间的对应关系,主要是依赖于微分的链式法则。同时还要考虑g函数是递增还是递减的。但是从使用的角度出发,如果知道了: y的分布; 知道了x和y的映射关系; 何必那么麻烦去计算x的分布呢? 求分布的目的不就是求概率吗... 阅读全文
posted @ 2016-03-27 21:40 永远是学生 阅读(1165) 评论(0) 推荐(0) 编辑
摘要: 好久不玩儿linux了,本来就不熟,现在几乎白痴。步骤如下: 从python官网上下载python的源代码 tar zvxf后得到一个文件夹; 进入Python-2.7.11,按照https://docs.python.org/2/using/unix.html#building-python 的指示, 先执行configure,他会生成Makefile make 编译 make instal... 阅读全文
posted @ 2016-03-25 19:50 永远是学生 阅读(356) 评论(0) 推荐(0) 编辑
摘要: 概率统计的是样本空间中具有特定性质的样本出现的频率。比如抛3个硬币,样本空间是:正正正,正正反,…………,反反反。如果我们只关心正面出现的次数,那么我们可以定义一个函数: f(样本)—》 实数 这样的函数就称为随机变量。简单的理解,它是样本的一个属性值。随机变量的意义在于把样本变成了数据,“样本”是个矢量,而随机变量是个标量。 ------------- 有了随机变量,我们就能定义累积分布函数,该... 阅读全文
posted @ 2016-03-24 22:55 永远是学生 阅读(568) 评论(0) 推荐(0) 编辑
摘要: 今天看到一篇文章,说人的知识分成两种,惰性知识和活性知识。那些对我们的工作,生活没有帮助的知识,称为惰性知识。惰性知识是用来装门面的,吹牛的。他不能解决我们的问题,只是填补我们生活的空虚。比如金鱼的记忆有几秒,就属于这种惰性知识。不过根据我最近的经验,我发现每天早上,当鱼儿们看见我拿起装鱼食的瓶子时,都很激动。这显然不是几秒记忆所能办到的。 为什么会有惰性知识呢?当一个知识不能与我们已有的知识... 阅读全文
posted @ 2016-03-23 23:32 永远是学生 阅读(1763) 评论(0) 推荐(1) 编辑
上一页 1 2 3 4 5 6 ··· 8 下一页