摘要:
unsorted_df=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7], columns=['col2','col1']) 8.1 按索引进行排序(sort_index()) ### 按索引排序,需要指定轴和方向,默认为列 阅读全文
摘要:
N=20 ### 直接列名迭代 df = pd.DataFrame({ 'A': pd.date_range(start='2016-01-01',periods=N,freq='D'), 'x': np.linspace(0,stop=N-1,num=N), 'y': np.random.rand 阅读全文
摘要:
6.1 reindex() 直接修改索引(相当于截取原 df 的子集) N=20 df = pd.DataFrame({ 'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),#freq设置步长,默认D表示日 'x': np.linspa 阅读全文
摘要:
def adder(ele1,ele2): return ele1+ele2 5.1 df 每个元素均变换 df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3']) df.pipe(adder,2)#对df中的每一个 阅读全文
摘要:
4.1 series对象的查看 s = pd.Series(np.random.randn(5)) s.axes#索引信息 s.empty#判断整体是否为空 s.ndim#返回对象维度 s.size#返回对象长度,或则说元素个数 s.values#以数组形式返回系列中的实际数据值 4.2 Dataf 阅读全文
摘要:
3.1 Dataframe的创建 利用 list 对象创建 data = [['Alex',10],['Bob',12],['Clarke',13]]#list对象可嵌套 df = pd.DataFrame(data,columns=['Name','Age'],dtype=float) data 阅读全文
摘要:
2.1 series的创建 利用 list对象 或 np.array对象 创建series s=pd.Series([1,3,np.nan,5,7]) data = np.array(['a','b','c','d']) s = pd.Series(data,index=[100,101,102,1 阅读全文
摘要:
import numpy as npimport pandas as pd 1.1 series、Dataframe的创建 s=pd.Series([1,3,np.nan,5,7]) dates=pd.date_range('19800801',periods=7)#创建时间序列 df=pd.Dat 阅读全文
摘要:
把以前在swirl课程学的基础数据清洗操作重新整理一遍,主要包括: dplyr包中的select、filter、arrange、mutate、group_by、summarize函数,以及%>% 管道操算符(pip operation),“then”的意思。 tidyr包中的gather、seper 阅读全文
摘要:
问题:如何在一张图上面绘制多组散点图和折线图?例如在下面的评分数据中,每轮数据绘制散点图,平均值绘制折线图。 数据(excel):营业厅评分数据 做法:R语言ggplot函数 library(readxl) library(ggplot2) data<-read_excel("C:\\...\\数据 阅读全文