摘要: 箱形图 优点: 不受异常值的影响, 可以以一种相对稳定的方式描述数据的离散分布情况 用于反映一组或多组连续型定量数据分布的中心位置和散布范围。 中位数 二分之一分位数 n为奇数 (n+1) /2 , 如果n为偶数,n/2 (n/2)-1 这两个位置的数求平均值。 上四分位数Q1 该样本中所有数值由小 阅读全文
posted @ 2020-05-09 22:54 籽俊 阅读(584) 评论(0) 推荐(0) 编辑
摘要: # 去重 duplicated() s = pd.Series([1,1,1,1,2,2,2,3,4,5,5,5,5,5]) print(s[s.duplicated()==False]) out: 0 1 4 2 7 3 8 4 9 5 dtype: int64 # 移除重复值,默认inplace 阅读全文
posted @ 2020-05-06 22:02 籽俊 阅读(119) 评论(0) 推荐(0) 编辑
摘要: # 字符串常用方法(1) - lower,upper,len,startswith,endswith s = pd.Series(['A','b','bbhello','123',np.nan]) print(s.str.lower(),'→ lower小写\n') print(s.str.uppe 阅读全文
posted @ 2020-05-06 17:14 籽俊 阅读(197) 评论(0) 推荐(0) 编辑
摘要: # axis,skipna 基本参数 df =pd.DataFrame({ 'key1':[4,5,3,np.nan,2], 'key2':[1,2,np.nan,4,5], 'key3':[1,2,3,'j','k']}, index= ['a','b','c','d','e']) print(d 阅读全文
posted @ 2020-05-06 15:34 籽俊 阅读(176) 评论(0) 推荐(0) 编辑
摘要: # 直接生成时间索引,支持str, datetime.datetime rng=pd.DatetimeIndex(['12/1/2017','12/2/2017','12/3/2017','12/4/2017','12/5/2017']) print(rng,type(rng)) print(rng 阅读全文
posted @ 2020-05-06 00:34 籽俊 阅读(1391) 评论(0) 推荐(0) 编辑
摘要: #获取当前的 年/月/日 today = datetime.date.today() out: 2020-05-05 # 获取指定的年/月/日 t = datetime.date(1992,4,2) out: 1992-04-02 # 获取当前本地时间的 年/月/日/ 时/分/秒 now =date 阅读全文
posted @ 2020-05-05 19:03 籽俊 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 1 a= [0,1,2,3,4,-5,9,-3,12,-4] 2 np.abs(a) out: array([ 0, 1, 2, 3, 4, 5, 9, 3, 12, 4]) 计算数组各元素的绝对值 python pandas 如何找到NaN、缺失值或者某些元素的索引名称以及位置,np.where的 阅读全文
posted @ 2020-05-02 12:21 籽俊 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 迭代器 可以直接作用于for循环的数据类型有以下几种:一类是集合数据类型,如 List , Tuple , Dict , Set , Str 等。 一类是generator , 包括生成器和带 yield 的 generator function. 这些可以直接作用于for循环的对象,统称为可迭代对 阅读全文
posted @ 2020-04-14 16:51 籽俊 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 生成器 只有在调用时才会生成相应的数据,只记录当前位置 列表生成式2 l = [x*2 for x in range(10)] 3 print(l)执行结果: [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]或者你会写成这样: 1 a=[] 2 for i in range(1 阅读全文
posted @ 2020-04-14 14:52 籽俊 阅读(1196) 评论(0) 推荐(0) 编辑
摘要: # Author: Jason Zhu # Tool: PyCharm 2017 # Python3.8 关于集合的使用方法 # num = {1,2,3,3,6,2,77,8,2} # list改为set集合 name1 = ['关羽','马超','关羽','马超','孙权'] print(typ 阅读全文
posted @ 2020-04-09 17:40 籽俊 阅读(229) 评论(0) 推荐(0) 编辑