上一页 1 ··· 5 6 7 8 9
摘要: def adder(ele1,ele2): return ele1+ele2 5.1 df 每个元素均变换 df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3']) df.pipe(adder,2)#对df中的每一个 阅读全文
posted @ 2020-04-30 10:53 unuliha 阅读(785) 评论(0) 推荐(0)
摘要: 4.1 series对象的查看 s = pd.Series(np.random.randn(5)) s.axes#索引信息 s.empty#判断整体是否为空 s.ndim#返回对象维度 s.size#返回对象长度,或则说元素个数 s.values#以数组形式返回系列中的实际数据值 4.2 Dataf 阅读全文
posted @ 2020-04-30 10:41 unuliha 阅读(1741) 评论(0) 推荐(0)
摘要: 3.1 Dataframe的创建 利用 list 对象创建 data = [['Alex',10],['Bob',12],['Clarke',13]]#list对象可嵌套 df = pd.DataFrame(data,columns=['Name','Age'],dtype=float) data 阅读全文
posted @ 2020-04-29 17:55 unuliha 阅读(1763) 评论(0) 推荐(0)
摘要: 2.1 series的创建 利用 list对象 或 np.array对象 创建series s=pd.Series([1,3,np.nan,5,7]) data = np.array(['a','b','c','d']) s = pd.Series(data,index=[100,101,102,1 阅读全文
posted @ 2020-04-29 16:58 unuliha 阅读(431) 评论(0) 推荐(0)
摘要: import numpy as npimport pandas as pd 1.1 series、Dataframe的创建 s=pd.Series([1,3,np.nan,5,7]) dates=pd.date_range('19800801',periods=7)#创建时间序列 df=pd.Dat 阅读全文
posted @ 2020-04-29 16:35 unuliha 阅读(1387) 评论(0) 推荐(0)
摘要: 把以前在swirl课程学的基础数据清洗操作重新整理一遍,主要包括: dplyr包中的select、filter、arrange、mutate、group_by、summarize函数,以及%>% 管道操算符(pip operation),“then”的意思。 tidyr包中的gather、seper 阅读全文
posted @ 2019-08-04 13:08 unuliha 阅读(3518) 评论(0) 推荐(1)
摘要: 问题:如何在一张图上面绘制多组散点图和折线图?例如在下面的评分数据中,每轮数据绘制散点图,平均值绘制折线图。 数据(excel):营业厅评分数据 做法:R语言ggplot函数 library(readxl) library(ggplot2) data<-read_excel("C:\\...\\数据 阅读全文
posted @ 2019-05-01 10:41 unuliha 阅读(31313) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9