随笔分类 -  kaggle案例

https://www.kaggle.com
摘要:Kaggle:Titanc Survived 数据处理 对于这个问题,在训练集中给了10列作为特征。其中有一些对结果预测并没有太大影响的PassengerId、Name、Cabin、Ticket。 PassengerId可以直接作为pandas读取cvs文件时候的index_col。 train_d 阅读全文
posted @ 2023-11-28 15:50 newbe3three 阅读(53) 评论(0) 推荐(0)
摘要:Kaggle:Otto Group ClassificationKaggle:Otto Group Classification 数据处理 导入相应的包之后,从csv文件中读取数据,指定id列为index列。本身id列也不携带预测信息。同时将训练数据和测试数据拼接在一起。 train_data = pd.read_csv("dataset/train.csv", 阅读全文
posted @ 2023-11-24 18:25 newbe3three 阅读(95) 评论(0) 推荐(0)
摘要:Kaggle:House PricesKaggle:House Prices 数据处理 首先是处理数据,导入相应的包,使用pandas读取csv文件,并指定Id列为index,本身Id这一列也不携带预测信息。同时将训练数据和测试数据拼接在一起以便后续的处理。 train_data = pd.read_csv("dataset/train 阅读全文
posted @ 2023-11-23 17:15 newbe3three 阅读(74) 评论(0) 推荐(0)