10 个 Kaggle 数据集,用于创建引人入胜的项目并加速你的学习
10 卡格尔 数据集创建引人注目的项目并加速您的学习
我将我的职业从会计转向数据科学,但从未使用过 Kaggle。
这是愚蠢的。
不要犯我的错误——使用这 10 个很棒的数据集(包括你可以用它们做什么的想法)。
1 — 亚马逊评论
- 计算基本产品分析
- 使用聚类算法对产品进行分组
- 无穷无尽的 NLP 用例:情感分析、关键字提取、摘要
2—— IBM 信用卡欺诈
- 为不平衡数据开发框架
- 建立监督机器学习模型来预测欺诈
- 使用聚类算法对消费者进行分组
3—— 足球
- 创建高级分析仪表板
- 建立一个有监督的机器学习模型来预测结果
- 使用聚类算法对玩家进行分组
4 — 世界粮食概况
- 创建高级分析仪表板
- 建立时间序列模型来预测价格
- 使用聚类算法对产品进行分组
5—— Spotify 歌曲歌词
- 使用音频功能创建独特的分析
- 构建神经网络来预测命中
- 使用聚类算法创建子流派
6—— 美国运通默认预测
- 构建管道以处理大数据
- 设计不平衡数据的抽样方法
- 建立监督机器学习模型来预测欺诈
使用您在 IBM 数据集上学到的知识并将其应用于大数据!
7—— 房价
- 计算分析套件
- 创建地理空间仪表板
- 建立有监督的机器学习模型来预测价格
8—— FourSquare 位置匹配
- 处理非结构化地理空间数据
- 构建地理空间分析
- 使用高级集群对位置进行分组
9— H&M时尚
- 构建管道以处理大数据
- 计算高级分析
- 创建推荐算法
10—— 加密市场
- 计算高级分析
- 建立时间序列预测模型
- 建立有监督的机器学习模型来预测价格
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具