数据挖掘入门 资料和步骤

最近不少朋友问到数据挖掘怎么入门,要看什么资料,

就想写一篇文章介绍一下入门步骤和资料,基本上下面的步骤是按顺序的,时间方面个人感觉至少需要小几个月

 

基础知识:

  • 线性代数
  • 统计学
  • 计算机技术

基本上这些东西不说熟悉,至少也要有点概念,或者是大学有上过对应的课程,不需要特别准备。

 

推荐书籍和资料:

视频:

中文:

  • 《数据挖掘概念与技术》  这本书我自己也挺喜欢的,适合初学者,涉及的面比较多,不过不够深入 (备选:《数据挖掘导论》)
  • 《数学之美》 介绍了一些挺有意思的东西

英文:

 

实践:

了解了数据挖掘是怎么回事以后,最好的学习办法就是开始实战,如果公司里面没有类似的项目,那么可以考虑去以下网站参加比赛,重在参与和学习

其他常用资料和网站:

  • 数据 如果你想要下载一些数据,这个网站可能会帮你
  • cos.name 这边有一些业界案例的ppt下载(年会那些),还有一些基本资料

数据挖掘工作中可能涉及到的技能和工具:

  • 业务知识
  • 数据清理和准备 (例如说sql server)
  • 建模和分析工具 (例如说R, Weka)
    • 算法和方案
  • Demo (PPT)
  • 大数据处理 (Hadoop/Mahout)
  • Coding (不管是自己做一点处理还是最终把产品带上线,都需要一些coding的能力)

posted on   听说读写  阅读(3461)  评论(2编辑  收藏  举报

编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· SQL Server 2025 AI相关能力初探
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示