摘要: 最近在做一些模型的校正,样本的选择对校正结果的参数影响很大,怎样保证样本的随机性和代表性。抽样的方式会用到random模块,特地总结说明,转用他人资料,作为笔记也好Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。random.randomrandom.... 阅读全文
posted @ 2015-07-06 09:43 whgiser 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 本文以实例详解了python的迭代器与生成器,具体如下所示:1. 迭代器概述:迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退。1.1 使用迭代器的优点对于原生支持随机访问的数据结构... 阅读全文
posted @ 2015-07-06 09:37 whgiser 阅读(285) 评论(0) 推荐(0) 编辑
摘要: 一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并除以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preproc... 阅读全文
posted @ 2015-06-01 11:03 whgiser 阅读(1139) 评论(0) 推荐(0) 编辑
摘要: 在处理微博数据的时候,经常会遇到对时间数据的处理,于是决定开始去一步一步的总结下Python关于时间的常见处理,主要以参考Python的官方文档为主,结合实例。接下来会一步一步更新,敬请期待 阅读全文
posted @ 2015-05-20 22:08 whgiser 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 局部代码块:作用:控制变量的生命周期;在程序中,当我们已经使用完 x 后,并且在接下来的代码中,不会再用到x,那么就没必要让x 在内存中占用空间了,这用情况下,可以使用 局部代码块,将x及其所设计到的区域封装为局部代码块,他们在程序执行中顺序不变,只是在执行完成后消失。表现形式,以代码体现如下: ... 阅读全文
posted @ 2015-05-19 21:30 whgiser 阅读(3455) 评论(0) 推荐(1) 编辑
摘要: 之前只知道设置变量的初始值为0。今天在写网络路径分析的时候,为了找到离任意坐标距离最近的节点,初始设置最短距离为无穷大,然后不断的去替换,直到找到最近的节点。 刚开始设置是min_dis = 999999999999,作为距离不是特别大的也是可以的,于是试想是不是Python提供了有无穷大的表... 阅读全文
posted @ 2015-05-05 09:56 whgiser 阅读(45608) 评论(0) 推荐(1) 编辑
摘要: 在微博中看到的一个不错的帖子,总结的很详细,拷贝过来,一是为了方便自己查阅,也能和大家一起共享,后面有原文的链接地址:在Java编程中,有些知识 并不能仅通过语言规范或者标准API文档就能学到的。在本文中,我会尽量收集一些最常用的习惯用法,特别是很难猜到的用法。(Joshua Bloch的《Effe... 阅读全文
posted @ 2015-05-02 09:44 whgiser 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也能分析html结构), 利用其lxml.html的xpath对html进行分析,获取抓取信息。 首先,我们需要安装一个支持xpath的python库。目前在libxml2的... 阅读全文
posted @ 2015-04-07 22:09 whgiser 阅读(62173) 评论(0) 推荐(3) 编辑
摘要: 聚类分析就仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组(簇)。其目标是,组内的对象相互之间是相似的,而不同组中的对象是不同的。组内相似性越大,组间差别越大,聚类就越好。 先介绍下聚类的不同类型,通常有以下几种: (1)层次的与划分的:如果允许簇具有子簇,则我们得到一个层次聚类。层次聚类 阅读全文
posted @ 2015-04-05 21:25 whgiser 阅读(9114) 评论(0) 推荐(0) 编辑
摘要: 自python2.6开始,新增了一种格式化字符串的函数str.format(),可谓威力十足。那么,他跟之前的%型格式化字符串相比,有什么优越的存在呢?让我们来揭开它羞答答的面纱。语法它通过{}和:来代替%。“映射”示例通过位置 字符串的format函数可以接受不限个参数,位置可以不按顺序,可以不用... 阅读全文
posted @ 2015-04-01 09:16 whgiser 阅读(1076) 评论(2) 推荐(0) 编辑