零基础入门到精通:Python大数据与机器学习之Pandas-数据操作

在这里还是要推荐下我自己建的Python开发学习群:483546416,群里都是学Python开发的,如果你正在学习Python ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2018最新的Python进阶资料和高级开发教程,欢迎进阶中和进想深入Python的小伙伴.

同时还要大数据学习群:784557197

实战练习
在Jupyter Notebook上执行以下代码:

import pandas as pd

df = pd.DataFrame({'col1':[1,2,3,4],'col2':[444,555,666,444],'col3':['abc','def','ghi','xyz']})

df.head()

获取唯一值

df['col2'].unique()

获取非唯一值

df['col2'].nunique()

获取每个值的个数

df['col2'].value_counts()

newdf = df[(df['col1']>2) & (df['col2']==444)]

newdf

应用函数

def times2(x):

return x*2

df['col1'].apply(times2)

df['col2'].apply(lambda x:x*2)


df['col3'].apply(len)

df['col1'].sum()

永久删除一列

del df['col1']

df


df = pd.DataFrame({'col1':[1,2,3,4],'col2':[444,555,666,444],'col3':['abc','def','ghi','xyz']})

df.drop('col1',axis=1,inplace=True)

df

posted @ 2018-06-14 01:03  CoXie带你学编程  阅读(760)  评论(0编辑  收藏  举报