数据科学引论——Python之道

什么是数据科学

什么是数据科学

  • 研究数据从中提取知识

    • 由来已久的科学:数据科学并不是一件新东西
    • 现代信息技术只是推动了数据科学的发展:并不是说现代信息技术创造了数据科学
      • AlphaGo using Netural Network 之后出现了AlphaGo zero,发现了一个几千年都没有人发现的棋谱。在大数据和数据处理能力下,人们的能力远远不及计算机的计算能力。
      • 可解释性比较弱,现在人工智能只是得到一个统计数据。大数据支撑了人工智能,机器学习帮助处理人类处理不了的大数据。
      • 抽样是有偏差的 是有误差的 因此就不抽样 直接一起进行处理(利用现在的技术)
      • 靠大数据的分析只是得到了关联性的结果 但并不是因果性的结果 只能说大数据的分析只是一定程度上反映了可能存在因果关系
    • 这里的数据,通常是指大数据,包含了结构化和非结构化数据
      • 结构化数据就是计算机可以读取的语言
      • 非结构化数据就是类似于手写数字之类的
    • 计算机科学 数学与统计学 专业领域
  • 问题驱动的数据科学

  • 关键:人们需要的不是数据,而是问题的答案。

posted @ 2019-10-09 18:27  Xiaojian_xiang  阅读(421)  评论(0编辑  收藏  举报