摘要:
reindex:重新索引 pandas对象有一个重要的方法reindex,作用:创建一个适应新索引的新对象 以Series为例 1 >>> series_obj = Series([4.5,1.3,5,-5.5],index=('a','b','c','d')) 2 >>> series_obj 3 阅读全文
摘要:
pandas的两个主要的数据结构: Series series是一种类似于一维数组的对象,它由一组数据(NumPy数组类型的数据)和一组与之相关的数据标签(索引)组成。 可以通过索引的方式选取或修改单个或一组值 对其对象进行NumPy运算的时候会保留索引和值之间的链接 还可以将Series对象看成一 阅读全文
摘要:
随机抽样 (numpy.random) 简单的随机数据 rand(d0, d1, ..., dn) 随机值 >>> np.random.rand(3,2) array([[ 0.14022471, 0.96360618], #random [ 0.37601032, 0.25528411], #ra 阅读全文
摘要:
这一章比较简单,内容也比较少。而且对于文件的读写,还是使用pandas比较好。numpy主要是读写文本数据和二进制数据的。 将数组以二进制的格式保存到硬盘上 主要的函数有numpy.save和numpy.load。默认情况下,数组是以未压缩的二进制保存为.npy的文件。 将多个数组保存到一个压缩文件 阅读全文
摘要:
将条件逻辑表述为数组运算 numpy.where()是一个三目运算的表达式 假设有上面三个数组,当condi中的值为True的时候,从xarr中选取值,否则从yarr中选取值,组成一个新的数组。利用普通的列表推导式如下: result = [(x if c else y) for x,y,c in 阅读全文
摘要:
通用函数(ufunc)是对ndarray中的数据执行元素级运算的函数。可看作简单函数的矢量化包装。 一元ufunc sqrt对数组中的所有元素开平方 exp对数组中的所有元素求指数 二元ufunc maximum 比较多个数组相同位置的元素,取大的值。注意,相互比较的数组shape必须一致 mini 阅读全文
摘要:
NumPy 的ndarray:一种多维数组对象 该对象是一个快速且灵活的大数据容器,可以利用这种数组对整个数据进行科学计算,语法跟标量元素之间的计算一样。 创建ndarray的方法: array函数:它接受一些序列型的对象,然后产生一个含有传入数据的numpy数组。 zeros ,ones 可以创指 阅读全文
摘要:
数据处理的一些基本任务: 与外界进行交互:读取各种文件(txt,csv,doc)和数据库中的数据 准备:对数据进行加工处理,清洗、变形等以便以后进行数据分析 转换:做一些数学和统计的计算,产生一个新的数据集。 建模和计算:将数据应用到统计模型、机器学习或其他计算工具中 展示:生成图表、图片、文字摘要 阅读全文
摘要:
1 ModelForm 2 a. class Meta: 3 model, # 对应Model的 4 fields=None, # 字段 5 exclude=None, # 排除字段 6 labels=None, # 提示信息 7 help_texts=None, # 帮助提示信息 8 widget 阅读全文
摘要:
1、HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理 HTTP 1.0规定浏览器与服务器只保持短暂的连接,浏览器的每次请求都需要与服务器建立一个TCP连接,服务器完成请求处理后立即断开TCP连接,服务器不跟踪每个客户也不记录过去的请求。 阅读全文