Python3数据分析pandas
pandas有两个主要数据结构:Series和DataFrame。
Series
Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成,即index和values两部分,可以通过索引的方式选取Series中的单个或一组值。
pd.Series(list,index=[ ]),第二个参数是Series中数据的索引,可以省略。
DataFrame
DataFrame是一个表格型的数据类型,每列值类型可以不同,是最常用的pandas对象。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。
pd.DataFrame(data,columns = [ ],index = [ ]):columns和index为指定的列、行索引,并按照顺序排列。
例:
1 2 3 4 5 6 7 8 9 | In [ 65 ]: pop = { 'Nevada' : { 2001 : 2.4 , 2002 : 2.9 }, ....: 'Ohio' : { 2000 : 1.5 , 2001 : 1.7 , 2002 : 3.6 }} In [ 66 ]: df3 = pd.DataFrame(pop) In [ 67 ]: df3 Out[ 67 ]: Nevada Ohio 2000 NaN 1.5 2001 2.4 1.7 2002 2.9 3.6 |
本文作者:durtime
本文链接:https://www.cnblogs.com/durtime/p/15694715.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
2020-12-15 每日日报