摘要: Sigmoid function也叫Logistic function, 在logistic regression中扮演将回归估计值h(x)从[-inf, inf]映射到[0,1]的角色。公式为:g(z) = 1 / (1 + exp(-z))如图:其输出值大于0.5这认为待分类对象属于1,否则则属... 阅读全文
posted @ 2014-11-10 09:55 KevinHwang 阅读(816) 评论(0) 推荐(0) 编辑
摘要: 梯度下降是回归问题中求cost function最小值的有效方法,对大数据量的训练集而言,其效果要好于非迭代的normal equation方法。 在将其用于多变量回归时,有两个问题要注意,否则会导致收敛速度小,甚至无法收敛。1. 特征均一化(Feature Scaling) 当特征量多时,... 阅读全文
posted @ 2014-11-08 15:43 KevinHwang 阅读(515) 评论(0) 推荐(0) 编辑
摘要: 最近在SAE上开发了一个给kindle退送书的小公众号(kindle免费书库),由于微信对http响应时间有限制,而推送本身是发邮件,当附件一大就很容易超时而使得用户收不到应答。一开始我是想通过多线程thread.start_new_thread的方式来多开线程发送,主线程直接告诉用户发过去了的... 阅读全文
posted @ 2014-11-07 10:15 KevinHwang 阅读(364) 评论(0) 推荐(0) 编辑
摘要: 数据库设计有1NF、2NF、3NF、BCNF、4NF、5NF。从左往右,越后面的数据库设计范式冗余度越低。满足后一个设计范式也必定满足前一个设计范式。1NF只要求每个属性是不可再分的,基本每个数据库都会满足。2NF要求每个联系都满足完全依赖,不能存在部分决定(partial dependency)。... 阅读全文
posted @ 2014-11-07 10:04 KevinHwang 阅读(1439) 评论(0) 推荐(0) 编辑
摘要: 比较简单,就直接上代码了:import weburls = ( '/', 'hello')app = web.application(urls, globals())class hello: def GET(self): print web.input() ... 阅读全文
posted @ 2014-11-04 14:38 KevinHwang 阅读(2487) 评论(0) 推荐(0) 编辑
摘要: KNN--k-NearestNeighbor可以是是分类法中最简单的算法了。大致的idea为:找出k各跟新数据点最像的点,看这些点主要属于哪类,那么新数据点也就属于哪类的了。其伪代码如下:1. 拿到一个新的数据点2. 计算其到training set中每个点的距离3. 对距离排序4. 对距离新数据点... 阅读全文
posted @ 2014-10-28 15:40 KevinHwang 阅读(769) 评论(0) 推荐(0) 编辑
摘要: 最近在玩爬虫,有时候会爬下来很多感兴趣文件的连接。如果自己手动下载它们的话工作量实在太大。于是,简单写了个下载小脚本:import os, urllib2os.chdir(r'd:')url = 'http://image16-c.poco.cn/mypoco/myphoto/20140826/09... 阅读全文
posted @ 2014-10-25 19:18 KevinHwang 阅读(684) 评论(0) 推荐(0) 编辑
摘要: 当要往mysql的table中录入数据量大的时候,直接从txt录入已有数据是一个愉快的选择。在录入数据前要做一些格式上的准备1. txt编码要是utf-8,无BOM2. 每行以\t\n结尾,每列间以\t间隔,如图:之后,就可以直接将数据录入table了 阅读全文
posted @ 2014-10-19 08:04 KevinHwang 阅读(430) 评论(0) 推荐(0) 编辑
摘要: 最近在学习数据库,但很少看到有适合入门的设计参考,故写下一个自己的实际设计以备忘。首先,我们来讲一个故事:从前有座山,山里有座庙(temple),庙里住着一位老和尚(monk),他给小和尚们讲故事,故事是这样的:从前这座山上有很多座庙,而且不止这一座山上有庙,附近很多山上都有庙,但是没有一座庙可以建... 阅读全文
posted @ 2014-10-18 15:23 KevinHwang 阅读(284) 评论(0) 推荐(0) 编辑