随笔分类 - kaggle案例
Kaggle:Titanc Survived
摘要:Kaggle:Titanc Survived 数据处理 对于这个问题,在训练集中给了10列作为特征。其中有一些对结果预测并没有太大影响的PassengerId、Name、Cabin、Ticket。 PassengerId可以直接作为pandas读取cvs文件时候的index_col。 train_d
Kaggle:Otto Group Classification
摘要:
Kaggle:Otto Group Classification 数据处理 导入相应的包之后,从csv文件中读取数据,指定id列为index列。本身id列也不携带预测信息。同时将训练数据和测试数据拼接在一起。 train_data = pd.read_csv("dataset/train.csv",

Kaggle:House Prices
摘要:
Kaggle:House Prices 数据处理 首先是处理数据,导入相应的包,使用pandas读取csv文件,并指定Id列为index,本身Id这一列也不携带预测信息。同时将训练数据和测试数据拼接在一起以便后续的处理。 train_data = pd.read_csv("dataset/train
