10 个 Kaggle 数据集,用于创建引人入胜的项目并加速你的学习

10 卡格尔 数据集创建引人注目的项目并加速您的学习

Photo by 约书亚·索尔蒂诺 on 不飞溅

我将我的职业从会计转向数据科学,但从未使用过 Kaggle。

这是愚蠢的。

不要犯我的错误——使用这 10 个很棒的数据集(包括你可以用它们做什么的想法)。

1 — 亚马逊评论

  • 计算基本产品分析
  • 使用聚类算法对产品进行分组
  • 无穷无尽的 NLP 用例:情感分析、关键字提取、摘要

2—— IBM 信用卡欺诈

  • 为不平衡数据开发框架
  • 建立监督机器学习模型来预测欺诈
  • 使用聚类算法对消费者进行分组

3—— 足球

  • 创建高级分析仪表板
  • 建立一个有监督的机器学习模型来预测结果
  • 使用聚类算法对玩家进行分组

4 — 世界粮食概况

  • 创建高级分析仪表板
  • 建立时间序列模型来预测价格
  • 使用聚类算法对产品进行分组

5—— Spotify 歌曲歌词

  • 使用音频功能创建独特的分析
  • 构建神经网络来预测命中
  • 使用聚类算法创建子流派

6—— 美国运通默认预测

  • 构建管道以处理大数据
  • 设计不平衡数据的抽样方法
  • 建立监督机器学习模型来预测欺诈

使用您在 IBM 数据集上学到的知识并将其应用于大数据!

7—— 房价

  • 计算分析套件
  • 创建地理空间仪表板
  • 建立有监督的机器学习模型来预测价格

8—— FourSquare 位置匹配

  • 处理非结构化地理空间数据
  • 构建地理空间分析
  • 使用高级集群对位置进行分组

9— H&M时尚

  • 构建管道以处理大数据
  • 计算高级分析
  • 创建推荐算法

10—— 加密市场

  • 计算高级分析
  • 建立时间序列预测模型
  • 建立有监督的机器学习模型来预测价格

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/33236/25411309

posted @   哈哈哈来了啊啊啊  阅读(884)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示