永远是学生 - 博客园

2016年4月

摘要：每次我想看电影的时候，都会去问我的朋友，小健。一般他推荐的电影，我都比较喜欢。显然不是所有人都有小健这样的能力。因为我碰巧和小健有类似的品味。这个生活中的经验，实际上有着广泛的用途。当系统需要为某个人做出推荐时，一种机器学习的算法是这样工作的：就是在一大群人中找出一部分与他品味类似的人，把这些人的喜欢的东西排序，然后推荐给他。自然引出两个问题：谁是与他相近品味的人；怎么对这些人喜欢的东... 阅读全文

posted @ 2016-04-07 23:37 永远是学生阅读(677) 评论(0) 推荐(0)

为什么需要架构图，怎么画？

摘要： Technorati 标签: 架构图,架构,交流,布局不知不觉中做架构师也已经4年了，最初的感觉只是一个名号，不再把代码作为强制的任务，后来开始慢慢的转变工作内容。画图，成为了我的主要工作。我可能不是每天都在写代码，但却是每天都在画图，而且我越来越觉得画图让我更容易说清楚。画架构图有几个好处：看清楚系统包含哪几个部分，各个部分实现什么职责，相互之间的关系是什么。当和别人讨论的时候，通过架构图可... 阅读全文

posted @ 2016-04-06 23:26 永远是学生阅读(5811) 评论(0) 推荐(0)

设计模式：visitor

摘要：拜访者模式（visitor）适用于对复杂结构体进行解析的场景。所谓复杂结构体，是指包含多个子元素的对象，比如集合，树，图，或者组合对象……。结构体中的每个元素，包括结构体本身实现接口： Element{ //element的信息属性，在此省略 //专门用于调用visitor的方法 void accept（visitor） } 所谓解析，是指提取结构体中各个元素的相关信息，组合起来。解析器实现接口... 阅读全文

posted @ 2016-04-01 22:15 永远是学生阅读(970) 评论(0) 推荐(0)

2016年3月

python使用httplib2访问REST服务的例子

摘要：首先你需要安装httplib2，这个可以在github上找到；然后你需要获得一个http连接的对象：con = httplib2.Http() 然后你需要发起连接：（6）resp, （5）content = con.request( （1）BAIDU_COM_API_COMMENTS, （2）method="POST", body=（3）body,headers=（4）header_data)参... 阅读全文

posted @ 2016-03-30 23:17 永远是学生阅读(2638) 评论(0) 推荐(0)

机器学习实战-ch3-决策树

摘要：决策树是一种新算法：优点：计算复杂度不高，输出结果易于理解，对中间值的缺失不敏感，可以处理不相关特征数据。缺点：可能会产生过度匹配问题。决策树算法可用于数据类型：数值型和标称型。决策树的核心在于选择正确的属性对数据进行划分。选择的标准是数据增益。信息增益：讲无序的数据变得更加有序。信息增益熵：如果把X分成n个类，每个类的概率为p（i），那么-log（p（i））的期望就是熵。如果分成... 阅读全文

posted @ 2016-03-29 23:06 永远是学生阅读(190) 评论(0) 推荐(0)

机器学习实战-ch2-有标签的聚类算法

摘要：本书中的这个聚类算法多少有些让人意外。通常的聚类算法是这样的：给定一堆点；给定一个距离计算的算法；给定一个cluster之间的距离d，或者最小的cluster数目k；初始化，每个点作为初始集群的中心；循环直到cluster个数小于K，或者任意两个cluster的距离大于d；计算每个点i到每个中心点j之间的距离，Dij；将绝对值最小的节点 i 汇总到cluster j中；重新计算... 阅读全文

posted @ 2016-03-27 22:26 永远是学生阅读(1102) 评论(0) 推荐(0)

统计推断3：随机变量变换，期望，方差

摘要：随机变量之间的存在映射关系。假如现实中随机变量X的概率分布很复杂，不容易看清楚，但是如果对X取一个函数，就会比较简单；那么我们可以定义Y=g(x)，的随机变量。有几个定理来描述Fx和Fy之间的对应关系，主要是依赖于微分的链式法则。同时还要考虑g函数是递增还是递减的。但是从使用的角度出发，如果知道了： y的分布；知道了x和y的映射关系；何必那么麻烦去计算x的分布呢？求分布的目的不就是求概率吗... 阅读全文

posted @ 2016-03-27 21:40 永远是学生阅读(1239) 评论(0) 推荐(0)

linux上安装python2.7.11

摘要：好久不玩儿linux了，本来就不熟，现在几乎白痴。步骤如下：从python官网上下载python的源代码 tar zvxf后得到一个文件夹；进入Python-2.7.11，按照https://docs.python.org/2/using/unix.html#building-python 的指示，先执行configure，他会生成Makefile make 编译 make instal... 阅读全文

posted @ 2016-03-25 19:50 永远是学生阅读(376) 评论(0) 推荐(0)

统计推断2：随机变量和概率密度

摘要：概率统计的是样本空间中具有特定性质的样本出现的频率。比如抛3个硬币，样本空间是：正正正，正正反，…………，反反反。如果我们只关心正面出现的次数，那么我们可以定义一个函数： f（样本）—》实数这样的函数就称为随机变量。简单的理解，它是样本的一个属性值。随机变量的意义在于把样本变成了数据，“样本”是个矢量，而随机变量是个标量。 ------------- 有了随机变量，我们就能定义累积分布函数，该... 阅读全文

posted @ 2016-03-24 22:55 永远是学生阅读(602) 评论(0) 推荐(0)

职业程序员的知识体系

摘要：今天看到一篇文章，说人的知识分成两种，惰性知识和活性知识。那些对我们的工作，生活没有帮助的知识，称为惰性知识。惰性知识是用来装门面的，吹牛的。他不能解决我们的问题，只是填补我们生活的空虚。比如金鱼的记忆有几秒，就属于这种惰性知识。不过根据我最近的经验，我发现每天早上，当鱼儿们看见我拿起装鱼食的瓶子时，都很激动。这显然不是几秒记忆所能办到的。为什么会有惰性知识呢？当一个知识不能与我们已有的知识... 阅读全文

posted @ 2016-03-23 23:32 永远是学生阅读(1788) 评论(0) 推荐(1)

公告