【经典大数据竞赛科普】泰坦尼克灾难 到底是个什么东西
@
目录
- 这是传奇性的Titanic ML竞赛-参加ML竞赛并熟悉Kaggle平台的工作原理的最佳,首要挑战。
- 这是国外Kaggle大数据网站的一个经典的入门比赛。这个网站要FQ。
简单来说,就是一个简单的大数据预测的题目:我们知道一些人的信息,比如这个人是否有兄弟姐妹,是否是头等舱,这样的信息,然后通过这些信息来预测这个人是否会在 泰坦尼克灾难中 幸存!
我们先来看看这次比赛提供的数据:
- survival:这个人幸存下来了,这也是我们要预测的值
- pclass:就是这个人做的是不是头等仓, class 1 = 1st, 2 = 2nd, 3 = 3rd
- sex: 性别
- Age:年龄
- sibsp:船上是否有他的兄弟姐妹
- parch:船上是否有他的父母
- ticket:船票的号码
- fare:所花费的船票的费用
- cabin:船舱的号码
- embarked:登船港口,泰坦尼克号总共有三个登船港口
这里有一部分的样本:
之后我也会讲解一些大神的做法,然后回详细介绍相关算法和知识
附件里:
train是训练集
test是测试机
然后我把标准答案也附在里面了,可以自己测试看看准确率。
人不可傲慢。
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步