kaggle - 函数记录

  • seaborn.heatmap
  • pandas.info(): 获得列信息,包括列名,个数和数据类型
  • pandas.drop('Cabin', axis=1, inplace=True):删除指定列,axis=1,表示删除列,
  • pandas.head():查看前6行数据,显示列名和6行数据
  • pandas.isnull().sum():统计列中含有空数据的总数
  • pandas.notnull().sum():统计列中含有非空数据的总数,命令行显示
  • pandas.dropna(inplace=True):删除含有空数据的行
  • pandas.drop(['Sex', 'Embarked', 'Name', 'Ticket', 'PassengerId'], axis=1, inplace=True):删除指定列数据且原地替换
  • predictors = train.drop(['Survived'], axis=1):删除指定列,并赋值给predictors,获得有效的数据
  • train = pd.concat([train, sex, embark], axis=1):将指定的三个数据合并,增加列的数据
  • (pandas)test[test['Fare'].isnull()]:显示测试数据test中'Fare'列中的空行,这样可以看到Fare之外的信息
  • test.at[152,'Fare'] = 50:对152行中的'Fare'列设置数据
  • pd.get_dummies(train['Sex'], drop_first=True):获得train数据‘Sex’列中dummy数据,并且丢弃第一列。数据太多造成算力负担,去掉第一列完全可以表示数据。
posted @ 2020-07-06 15:21  绍荣  阅读(123)  评论(0编辑  收藏  举报