随笔分类 -  大数据相关

摘要:pandas处理起来大批量数据是很方便的,本文主要是根据自己的工作经验总结一下pandas里不同循环方法的优劣 import pandas as pd import numpy as np 初级:for循环 #for 循环主要是把df表格拆分成一行一行的遍历主要有3种方法 df1 = pd.Data 阅读全文
posted @ 2021-10-15 19:32 Franciszw 阅读(226) 评论(0) 推荐(0) 编辑
摘要:一,DataFrame转字典格式 DataFrame.to_dict (orient='dict') 函数种只需要填写一个参数:orient 即可 ,但对于写入orient的不同,字典的构造方式也不同,官网一共给出了6种,orient的名字与转成字典value的格式有关系. 1.orient ='d 阅读全文
posted @ 2021-03-03 17:31 Franciszw 阅读(2025) 评论(0) 推荐(0) 编辑
摘要:#1 import pandas as pd #2 pd.__version__ '1.0.5' #3 pd.show_versions() INSTALLED VERSIONS commit : None python : 3.8.3.final.0 python-bits : 64 OS : D 阅读全文
posted @ 2021-03-02 18:01 Franciszw 阅读(1761) 评论(0) 推荐(0) 编辑
摘要:一,排序 sort_values()函数的具体参数 DataFrame.sort_values(by=‘##’,axis=0,ascending=True, inplace=False, na_position=‘last’) by=[多个变量],ascending=[多个变量的排序规则],默认是T 阅读全文
posted @ 2021-03-02 16:46 Franciszw 阅读(287) 评论(0) 推荐(0) 编辑
摘要:pandas中对DataFrame筛选数据的方法有很多的,以后会后续进行补充,这里只整理遇到错误的情况。 1.使用布尔型DataFrame对数据进行筛选 使用一个条件对数据进行筛选,代码类似如下: num_red=flags[flags['red']==1] 使用多个条件对数据进行筛选,代码类似如下 阅读全文
posted @ 2021-03-02 14:48 Franciszw 阅读(4639) 评论(0) 推荐(0) 编辑
摘要:1.获取列 df['country'] df[['country','year']] #不能通过df[0]获取第一列,如果想通过列的索引位置获取列需要用到loc #获取所有列名 df.columns #得到一个Index类型 list(df.columns)#将得到的Index类型转成列表 2.获取 阅读全文
posted @ 2021-02-23 16:51 Franciszw 阅读(391) 评论(0) 推荐(0) 编辑
摘要:#Pandas数据结构Dataframe:基本技巧 #数据查看、转置 / 添加、修改、删除值 / 对齐 / 排序 import numpy as np import pandas as pd #数据查看、转置 df = pd.DataFrame(np.random.rand(10).reshape( 阅读全文
posted @ 2020-10-28 00:42 Franciszw 阅读(450) 评论(0) 推荐(0) 编辑
摘要:#Dataframe既有行索引也有列索引,可以被看做由多个Series组成的字典(共用一个索引) #索引方法有多种,记住这5种常用的方法即可 #只选择列 / 只选择行 / 选择行和列 /链式选择 / 布尔判断选择 #一,只选择列 # df[列名],选择列的方法只记这这一种即可,其他的都是不常用的,几 阅读全文
posted @ 2020-10-28 00:41 Franciszw 阅读(1693) 评论(0) 推荐(0) 编辑
摘要:# Dataframe是一个表格型的数据结构,“带有标签的二维数组”。 # Dataframe带有index(行标签)和columns(列标签) #DateFrame简介 import numpy as np import pandas as pd date = {'a':[1,2,3,4],'b' 阅读全文
posted @ 2020-10-28 00:39 Franciszw 阅读(2458) 评论(0) 推荐(0) 编辑
摘要:#jupyter-notebook常用快捷键 执行当前cell:Ctrl+enter 插入一个cell:Alt+enter 新增一个cell:shift+enter Series介绍 #1.Series的索引和值 import numpy as np import pandas as pd s = 阅读全文
posted @ 2020-10-25 00:20 Franciszw 阅读(233) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示
深色
回顶
展开