摘要:
# 替换 .replace 一个替换就用逗号就行了,多个就用字典 s = pd.Series(list('ascaazsd')) print(s.replace('a', np.nan)) print(s.replace(['a','s'] ,np.nan)) print(s.replace({'a 阅读全文
摘要:
# 去重 .duplicated s = pd.Series([1,1,1,1,2,2,2,3,4,5,5,5,5]) print(s.duplicated()) print(s[s.duplicated() == False]) print(' ') # 判断是否重复 # 通过布尔判断,得到不重复 阅读全文
摘要:
import pandas as pd df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'], 'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3']}) df2 = pd.DataF 阅读全文
摘要:
拼接 # 连接:concat s1 = pd.Series([1,2,3]) s2 = pd.Series([2,3,4]) print(pd.concat([s1,s2])) print(' ') # 默认axis=0,行+行 s3 = pd.Series([1,2,3],index = ['a' 阅读全文
摘要:
# 读取普通分隔数据:read_table # 可以读取txt,csv import os os.chdir('C:/Users/iHJX_Alienware/Desktop/') data1 = pd.read_table('data1.txt', delimiter=',',header = 0 阅读全文
摘要:
s = pd.Series(['A','b','C','bbhello','123',np.nan,'hj']) df = pd.DataFrame({'key1':list('abcdef'), 'key2':['hee','fv','w','hija','123',np.nan]}) print 阅读全文
摘要:
import pandas as pd import numpy as np np.random.seed(7) df1 = pd.DataFrame(np.arange(20).reshape(5, 4), columns=['A', 'B', 'C', 'D']) df2 = pd.DataFr 阅读全文
摘要:
# 成员资格:.isin() s = pd.Series(np.arange(10,15)) df = pd.DataFrame({'key1':list('asdcbvasd'), 'key2':np.arange(4,13)}) print(s) print(df) print(' ') pri 阅读全文
摘要:
# 唯一值:.unique() s = pd.Series(list('asdvasdcfgg')) sq = s.unique() print(s) print(sq,type(sq)) print(pd.Series(sq)) # 得到一个唯一值数组 # 通过pd.Series重新变成新的Ser 阅读全文
摘要:
# 值计数:.value_counts() sc = s.value_counts(sort = False) # 也可以这样写:pd.value_counts(sc, sort = False) print(sc) # 得到一个新的Series,计算出不同值出现的频率 # sort参数:排序,默认 阅读全文