df.sort_values() 按照某列排序
摘要:sort_value sort_values,按照某一列的大小进行排序,(沿任一轴的值排序) DataFrame.sort_values(by,axis = 0,ascending = True,inplace = False,kind = ' quicksort ',na_position = '
阅读全文
posted @
2020-09-18 15:12
小小喽啰
阅读(18845)
推荐(0) 编辑
df.set_index() 使用现有列设置单(复合)索引,df.reset_index()还原索引
摘要:set_index DataFrame可以通过set_index方法,可以使用现有列设置单索引和复合索引 DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 参数: key
阅读全文
posted @
2020-09-18 14:38
小小喽啰
阅读(9170)
推荐(0) 编辑
df.rename() 重新命名列名
摘要:rename方法作用: 复制 DataFrame并对其索引index和列标签columns进行赋值。如果希望就地修改某个数据集,传入inplace=True即可 DataFrame.rename(**kwargs) 参数: mapper:dict-like or function,这个字段我也不是很
阅读全文
posted @
2020-09-18 10:37
小小喽啰
阅读(14695)
推荐(1) 编辑
pd.Categorical.from_codes()用于类别替换
摘要:原来版本是pd.Factor,新版本换成了pd.Categorical.from_codes(),功能都一样; 实例: pd.Categorical.from_codes(iris.target, iris.target_names) 原来的target是这样的: array([0, 0, 0, 0
阅读全文
posted @
2020-09-02 18:46
小小喽啰
阅读(1018)
推荐(1) 编辑
df.mask() 和df.where() 替换方法区别
摘要:具体用法详情请看:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.mask.html, 现在主要说一下区别: where 是条件为False才替换,而mask是条件为True才替换 import
阅读全文
posted @
2020-08-31 15:17
小小喽啰
阅读(1709)
推荐(0) 编辑
pandas 网址
摘要:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.to_datetime.html 里面有多种函数的用法
阅读全文
posted @
2020-08-24 09:48
小小喽啰
阅读(291)
推荐(0) 编辑
pandas的reshape(1,-1)
摘要:reshape可以用于numpy库里的ndarray和array结构以及pandas库里面的DataFrame和Series结构。reshape用来更改数据的列数和行数reshape(行,列)可以根据指定的数值将数据转换为特定的行数和列数;那么reshape(1,-1)或者reshape(-1,1)
阅读全文
posted @
2020-08-19 10:54
小小喽啰
阅读(1769)
推荐(0) 编辑
pd.to_datetime() 时间处理函数
摘要:pd.to_datetime() 因为不了解该段代码意思: # 不过要注意,数据里有时间出错的格式,所以我们需要 errors='coerce' data['used_time'] = (pd.to_datetime(data['creatDate'], format='%Y%m%d', error
阅读全文
posted @
2020-08-18 10:34
小小喽啰
阅读(54154)
推荐(1) 编辑
pandas 的 df.as_matrix() 表格转换成数组函数用法
摘要:df.as_matrix()可将dataframe数据转换成数组,和df.values 用法一致,但是现在一般使用values ,二者返回的都是数组 #原始DataFrame import pandas as pd import numpy as np df=pd.DataFrame(np.aran
阅读全文
posted @
2020-08-14 10:08
小小喽啰
阅读(2343)
推荐(0) 编辑
pandas 的 notnull() 的返回非空值函数的用法
摘要:df.notnull() 返回的是布尔值 data原始数据如下: import numpy as np import pandas as pd from pandas import Series,DataFrame data=DataFrame() data['a']=[1,2,3,4] data[
阅读全文
posted @
2020-08-13 18:58
小小喽啰
阅读(3630)
推荐(1) 编辑
pandas.ix() 函数使用方法
摘要:pandas中有iloc、loc、ix数据提取方法,其中 iloc:是位置索引 loc:是标签索引 ix:结合了iloc和loc的用法,首先会尝试loc一样的行为,如果索引中不存在标签,则会退回iloc一样的行为 但是已经不建议使用ix 用法就不赘述了
阅读全文
posted @
2020-08-13 18:40
小小喽啰
阅读(1503)
推荐(0) 编辑
pandas 的stack() 和unstack() 函数
摘要:pandas进行数据重排时,经常用到stack和unstack两个函数。stack的意思是堆叠,堆积,unstack即“不要堆叠” 常见的数据的层次化结构有两种,一种是表格,一种是“花括号”,即下面这样的l两种形式: stack函数会将数据从”表格结构“变成”花括号结构“,即将其行索引变成列索引,反
阅读全文
posted @
2020-08-13 16:10
小小喽啰
阅读(2148)
推荐(2) 编辑
pandas.date_range() 时间序列
摘要:pd.date_range()使用方法 pd.date_range()函数文档 pandas.date_range(start=None, end=None, periods=None, freq='D', tz=None, normalize=False, name=None, closed=No
阅读全文
posted @
2020-08-11 14:54
小小喽啰
阅读(1717)
推荐(0) 编辑
pandas replace() 替换用法
摘要:2021.02.05补充 之前写的替换都是整个值,也即是说如果被替换值='asdfg',之前的只有值等于='asdfg',才可以被替换,但是我们很多时候是值想替换局部的,比如说‘深圳地区’,替换为‘深圳市’,那么就得先str,代码如下: main_copy['city']=main_copy['ci
阅读全文
posted @
2020-07-22 18:38
小小喽啰
阅读(38892)
推荐(0) 编辑
pd.get_dummies()独热编码和pd.factorize()的用法
摘要:离散特征的编码分为两种情况:1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3} 一、pd.get_dummies() 一种字符
阅读全文
posted @
2020-07-20 10:53
小小喽啰
阅读(3518)
推荐(0) 编辑
pandas 的df.smaple()抽样函数
摘要:df.sample()就是抽样函数,参数如下: df.sample(n=None,frac=None,replace=Flase,weights=None,random_state=None,axis=None) 参数说明: n:就是样本量,如果不写,就是抽一条数据 frac:抽样比,就是样本量占全
阅读全文
posted @
2020-07-17 14:57
小小喽啰
阅读(2164)
推荐(0) 编辑
pandas 的pd.cut() 和pd.qcut() 数据分箱
摘要:pd.cut() 是把一组数据按照一定bins分割成离散的区间,得到的数据是每个值的落到的区间,此函数对于从连续变量转换为离散变量也很有用 #参数如下: pd.cut(x, bins, right=True, labels=None, retbins=False, precision=3, incl
阅读全文
posted @
2020-07-16 16:55
小小喽啰
阅读(5005)
推荐(0) 编辑
pandas 的groupby()
摘要:2022.10.08增加了25 个例子学会Pandas Groupby 操作! (qq.com) groupby() DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, s
阅读全文
posted @
2020-07-16 15:00
小小喽啰
阅读(1011)
推荐(0) 编辑
pandas 的apply() 函数
摘要:pandas的apply函数是自动根据function遍历每一个数据,然后返回一个数据结构为Series的结果 DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds) 参数解释:
阅读全文
posted @
2020-07-16 11:08
小小喽啰
阅读(4950)
推荐(0) 编辑
pandas 的pd.melt() 将宽表变成长表
摘要:pd.melt() 什么时候用到,画图时候用到,又或者是统计数据时用到 将宽数据变成长数据 pd.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None) 参数说明 fr
阅读全文
posted @
2020-07-13 14:29
小小喽啰
阅读(1666)
推荐(0) 编辑