随笔分类 - python数分
利用Python进行数据分析的学习记录
摘要:在C语言中我们可以通过struct关键字定义结构类型,结构中的字段占据连续的内存空间,每个结构体 占用的内存大小都相同,因此可以很容易地定义结构数组。和C语言一样,在NumPy中也很容易对这 种结构数组进行操作。只要NumPy中的结构定义和C语言中的定义相同,NumPy就可以很方便地读取 C语言的结
阅读全文
摘要:1.从excel里读取数据 book=xlrd.open_workbook(r'D:\360MoveData\Users\Song\Desktop\Test.xls') sheet1=book.sheets()[0] nrows=sheet1.nrows ncols=sheet1.ncols pri
阅读全文
摘要:1. loc(索引名 -取值) 先行后列 loc是基于自定义的索引名来切片 loc切片包含起始和结尾 可以通过行索引编号 + 自定义的列索引名组合来切片 DataFrame 不能直接切片,可以通过loc来做切片 dataframe.loc['b':'d'] dataframe.loc[0:2, 'a
阅读全文
摘要:多项式拟合的简单代码: import matplotlib.pyplot as plt import numpy as np x=[1,2,3,4,5,6,7,8] y=[1,4,9,13,30,25,49,70] a=np.polyfit(x,y,2) #用2次多项式拟合x,y数组 b=np.po
阅读全文
摘要:解决《利用python进行数据分析》P139报错问题 index must be monotonic increasing or decreasingframe.reindex(index=['a','b','c','d'],method='ffill',columns=states)报错:inde
阅读全文
摘要:1.Pandas的数据结构介绍--Series Series类似于一维数组的对象,它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成.Series的字符串表示形式为:索引在左边,值在右边.可以通过Series的 values和index属性获取其数组表示形式和索引对象:
阅读全文
摘要:一.range用法 函数说明:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。 >>> range(5) [0, 1, 2, 3, 4] >>> range(1,5) [1, 2, 3, 4] >>> range(0,
阅读全文
摘要:一.比较两个函数 先来看看random.randint() import random for n in range(5): for i in range(10): print(random.randint(1,5),end=' ') print() #运行结果 1 5 5 3 3 1 3 1 5
阅读全文
摘要:随机数生成是日常工作中经常使用的功能。下面简要介绍下Python的随机数生成标准库random。 一、常用函数 (1)生成0和1之间的浮点数,random()生成区间为[0,1)import randomprint(random.random())输出结果:0.8092116913076974(2)
阅读全文
摘要:随机数生成 1.取得标准正态分布的样本 2.Numpy.random在产生大量样本值得时候要比Python的快多了 在这里简单介绍下Python内置的random模块的normalvariate(mu,sigma) mu:均值 sigma:标准差 mu=0,sigma=1为标准正态分布。 除了均匀分
阅读全文
摘要:线性代数(如矩阵乘法\矩阵分解\行列式以及其他的方阵数学)是任何数组库的重要组成部分.在Python中,*得到的是元素级的积,而不是一个矩阵点积.因此,Numpy提供了dot函数. 1.dot函数--矩阵相乘 一个二维数组跟一个合适大小的一维数组矩阵点积运算之后会得到一个一维数组: 这里补充一下ze
阅读全文
摘要:1.唯一化以及其他的集合逻辑 Numpy提供了一些针对一维ndarray的基本集合运算.最常用的可能要数np.unique了,它用于找出数组中的唯一值并返回已排序的结果: 数组的集合运算: 2.用于数组的文件输入输出 1)将数组以二进制格式保存到磁盘np.save和np.load In [36]:
阅读全文
摘要:1.排序 1)Numpy数组通过sort()方法进行排序: 2)多维数组可以在轴向上进行排序 注意:顶级方法np.sort返回的是数组的已排序副本,而就地排序则会修改数组本身. 计算数组分位数最简单的办法是对齐进行排序
阅读全文
摘要:1.用于布尔型数组的方法 在前一节所列的所有的基本数组统计方法中,布尔值会被强制转换为1(True)和0(False). 由此产生了一些应用: 1)对布尔型数组中的True值计数 In [30]: arr=np.random.randn(100) In [31]: (arr>0).sum() #正值
阅读全文
摘要:1.数学和统计方法 可以通过数组上的一组数学函数对整个数组或某个周详的数据进行统计运算.sum\mean\以及标准差std等聚合运算(aggregation)既可以当做数组的实例方法调用,也可以当做Numpy函数使用: 1)对整个数组进行计算 2)接收axis上的参数,计算轴向上的统计值,最终结果是
阅读全文
摘要:1.zip函数描述 zip() 函数用于将可迭代对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象。 如果各个可迭代对象的元素个数不一致,则返回的对象长度与最短的可迭代对象相同。 利用 * 号操作符,与zip相反,进行解压。 2.zip函数语法 zip(iterable1
阅读全文
摘要:1.利用数组进行数据处理 Numpy可以使你将许多中种数据处理任务表述为简洁的数组表达式.(否则需要编写循环).用数组表达式代替循环的做法,通常被称为矢量化. 以下是矢量化的一个例子: import numpy as np import matplotlib.pyplot as plt points
阅读全文
摘要:本文为转载,原博客地址:https://blog.csdn.net/huzq1976/article/details/51581330 首先注明:如果没有特别说明,以下内容都是基于python 3.4的。 1. /是精确除法,//是向下取整除法,%是求模2. %求模是基于向下取整除法规则的3. 四舍
阅读全文
摘要:modf是一个ufunc,也就是通用函数.通用函数的意思是对ndarray中的数据执行元素级运算的函数.也可以将其开成矢量化包装器(接受一个或多个标量值,并产生一个或多个标量值). 以一个简单的例子来说明modf的用法: modf() 方法返回x的整数部分与小数部分,两部分的数值符号与x相同,整数部
阅读全文
摘要:今天在网上搜寻了许多博客,始终没有真正理解numpy中的transpose()函数, transpose 的原理其实是根据维度(shape)索引决定的,举个栗子: x = np.arange(4).reshape((2,2)) //生成一个2x2的数组print(x)[[0 1] [2 3]]我们生
阅读全文