03 2016 档案

摘要:首先你需要安装httplib2,这个可以在github上找到; 然后你需要获得一个http连接的对象:con = httplib2.Http() 然后你需要发起连接:(6)resp, (5)content = con.request( (1)BAIDU_COM_API_COMMENTS, (2)method="POST", body=(3)body,headers=(4)header_data)参... 阅读全文
posted @ 2016-03-30 23:17 永远是学生 阅读(2601) 评论(0) 推荐(0) 编辑
摘要:决策树是一种新算法: 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。 决策树算法可用于数据类型:数值型和标称型。 决策树的核心在于选择正确的属性对数据进行划分。选择的标准是数据增益。信息增益:讲无序的数据变得更加有序。 信息增益熵:如果把X分成n个类,每个类的概率为p(i),那么-log(p(i))的期望就是熵。 如果分成... 阅读全文
posted @ 2016-03-29 23:06 永远是学生 阅读(178) 评论(0) 推荐(0) 编辑
摘要:本书中的这个聚类算法多少有些让人意外。通常的聚类算法是这样的: 给定一堆点; 给定一个距离计算的算法; 给定一个cluster之间的距离d,或者最小的cluster数目k; 初始化,每个点作为初始集群的中心; 循环直到cluster个数小于K,或者任意两个cluster的距离大于d; 计算每个点i到每个中心点j之间的距离,Dij; 将绝对值最小的节点 i 汇总到cluster j中; 重新计算... 阅读全文
posted @ 2016-03-27 22:26 永远是学生 阅读(1022) 评论(0) 推荐(0) 编辑
摘要:随机变量之间的存在映射关系。假如现实中随机变量X的概率分布很复杂,不容易看清楚,但是如果对X取一个函数,就会比较简单;那么我们可以定义Y=g(x),的随机变量。有几个定理来描述Fx和Fy之间的对应关系,主要是依赖于微分的链式法则。同时还要考虑g函数是递增还是递减的。但是从使用的角度出发,如果知道了: y的分布; 知道了x和y的映射关系; 何必那么麻烦去计算x的分布呢? 求分布的目的不就是求概率吗... 阅读全文
posted @ 2016-03-27 21:40 永远是学生 阅读(1165) 评论(0) 推荐(0) 编辑
摘要:好久不玩儿linux了,本来就不熟,现在几乎白痴。步骤如下: 从python官网上下载python的源代码 tar zvxf后得到一个文件夹; 进入Python-2.7.11,按照https://docs.python.org/2/using/unix.html#building-python 的指示, 先执行configure,他会生成Makefile make 编译 make instal... 阅读全文
posted @ 2016-03-25 19:50 永远是学生 阅读(356) 评论(0) 推荐(0) 编辑
摘要:概率统计的是样本空间中具有特定性质的样本出现的频率。比如抛3个硬币,样本空间是:正正正,正正反,…………,反反反。如果我们只关心正面出现的次数,那么我们可以定义一个函数: f(样本)—》 实数 这样的函数就称为随机变量。简单的理解,它是样本的一个属性值。随机变量的意义在于把样本变成了数据,“样本”是个矢量,而随机变量是个标量。 ------------- 有了随机变量,我们就能定义累积分布函数,该... 阅读全文
posted @ 2016-03-24 22:55 永远是学生 阅读(568) 评论(0) 推荐(0) 编辑
摘要:今天看到一篇文章,说人的知识分成两种,惰性知识和活性知识。那些对我们的工作,生活没有帮助的知识,称为惰性知识。惰性知识是用来装门面的,吹牛的。他不能解决我们的问题,只是填补我们生活的空虚。比如金鱼的记忆有几秒,就属于这种惰性知识。不过根据我最近的经验,我发现每天早上,当鱼儿们看见我拿起装鱼食的瓶子时,都很激动。这显然不是几秒记忆所能办到的。 为什么会有惰性知识呢?当一个知识不能与我们已有的知识... 阅读全文
posted @ 2016-03-23 23:32 永远是学生 阅读(1763) 评论(0) 推荐(1) 编辑
摘要:领域驱动设计围绕着对象进行设计,类似于传统的OO,但是还是不同的。 传统的OO更像是贫血的领域对象,它具有数据,很多get set方法,但是缺少业务逻辑。客户端使用时,需要进行一大串的set操作。举个栗子: 这种方式中customer是一个贫血的领域对象,客户端必须进行很多的set,最后调用dao进行保存。 --------------- 那么,怎样才是不贫血的领域对象呢?主要看两点:boun... 阅读全文
posted @ 2016-03-22 23:06 永远是学生 阅读(223) 评论(0) 推荐(0) 编辑
摘要:概率是指事件发生的可能性。 首先描述一个场景,A,B,C,D四个玩家,每人3张牌,前面2张都公开,后面一张不公开。 刚开始时,让你估算下其他3个玩家拿到3张A的可能性。它等于4/C(54,3)。 这个概率对每个人,任何时刻都是一样的,他就是一个客观的数据,从实用的角度来说,它没有意义。这对大家都是一样的。 什么用都没有。这个概率对谁都是一样的,没有人会因为这个数字跟牌或者弃牌。 但是随着牌局的进展... 阅读全文
posted @ 2016-03-20 22:08 永远是学生 阅读(4591) 评论(0) 推荐(1) 编辑
摘要:Technorati 标签: 组合,概率 从N个不同的球中取出M个,一共有多少种取法? 这个问题是组合数据的基本问题,考虑拿出球是否放回,拿出去的球是否有序,它有4种变体: 不放回,有序; 不放回,无序; 放回,无序; 放回,有序; 对于第一种,取出M个球,第一个有N种可能,第二个N-1种可能,依次类推,M个球共有: N*(N-1)*(N-2)*..*(N-M+1), 举个例子:3个同学(A,B... 阅读全文
posted @ 2016-03-20 16:14 永远是学生 阅读(6836) 评论(0) 推荐(0) 编辑