零基础入门到精通:Python大数据与机器学习之Pandas-数据操作
在这里还是要推荐下我自己建的Python开发学习群:483546416,群里都是学Python开发的,如果你正在学习Python ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2018最新的Python进阶资料和高级开发教程,欢迎进阶中和进想深入Python的小伙伴.
同时还要大数据学习群:784557197
实战练习
在Jupyter Notebook上执行以下代码:
import pandas as pd
df = pd.DataFrame({'col1':[1,2,3,4],'col2':[444,555,666,444],'col3':['abc','def','ghi','xyz']})
df.head()
获取唯一值
df['col2'].unique()
获取非唯一值
df['col2'].nunique()
获取每个值的个数
df['col2'].value_counts()
newdf = df[(df['col1']>2) & (df['col2']==444)]
newdf
应用函数
def times2(x):
return x*2
df['col1'].apply(times2)
df['col2'].apply(lambda x:x*2)
df['col3'].apply(len)
df['col1'].sum()
永久删除一列
del df['col1']
df
df = pd.DataFrame({'col1':[1,2,3,4],'col2':[444,555,666,444],'col3':['abc','def','ghi','xyz']})
df.drop('col1',axis=1,inplace=True)
df