数据科学引论——Python之道
什么是数据科学
什么是数据科学
-
研究数据从中提取知识
- 由来已久的科学:数据科学并不是一件新东西
- 现代信息技术只是推动了数据科学的发展:并不是说现代信息技术创造了数据科学
- AlphaGo using Netural Network 之后出现了AlphaGo zero,发现了一个几千年都没有人发现的棋谱。在大数据和数据处理能力下,人们的能力远远不及计算机的计算能力。
- 可解释性比较弱,现在人工智能只是得到一个统计数据。大数据支撑了人工智能,机器学习帮助处理人类处理不了的大数据。
- 抽样是有偏差的 是有误差的 因此就不抽样 直接一起进行处理(利用现在的技术)
- 靠大数据的分析只是得到了关联性的结果 但并不是因果性的结果 只能说大数据的分析只是一定程度上反映了可能存在因果关系
- 这里的数据,通常是指大数据,包含了结构化和非结构化数据
- 结构化数据就是计算机可以读取的语言
- 非结构化数据就是类似于手写数字之类的
- 计算机科学 数学与统计学 专业领域
-
问题驱动的数据科学
-
关键:人们需要的不是数据,而是问题的答案。