随笔
主题-数据科学
今天跟大家直播探讨的主题就是数据科学,探讨数据科学在公司中的应用,数据科学的前景,以及要成为数据科学从业者的一个规划。
数据科学,就是运用一些科学化的方法,去了解数据,运用数据。
案例:AlphaGo
大家都知道AlphaGo战胜顶尖棋手的故事,那么考考大家几个问题?
1、AlphaGo是哪个公司创造的?——深度思维(DeepMind),是一家英国公司,仅仅成立五年
2、AlphaGo底层的算法?——深度学习
一直以来,在技术科学领域,都认为围棋是机器最不可能获胜的一个项目,但随着数据科技的发展,这个神话已经被打破
那么,对于未来我们就会有无尽的遐想,我们思考一个“宇宙性”(呵呵),“人伦性”的问题,就是机器是否会终结人类,取代人类。
案例:特斯拉(Tesla)汽车
特斯拉,我们都不陌生,以前人说,人类为了解决迁移的痛点,发明了汽车,可是呢,汽车还是需要人类的一个驾驶,
特斯拉实现无人驾驶的基本原理就是,在车子上安了大量的感测器,它可以感测到周围环境的变化,可以控制车内所有的零件。
这样就实现了特斯拉的口号:‘让自动驾驶不再是梦想’,
人工智能
上面的两个案例,都是人工智能的一个体现。
人工智能与“喂数据”
我们只要把一些数据“喂”(什么是喂数据)给电脑以后,电脑就会学习这些数据,并展现一个模型出来,而这个模型可以协助电脑做出决策,进而这些决策可以取代人类重复性高的一些工作,为我们去创造一个更多的想像与新可能
人工智能的与数据科学的关系
1、人工智能最不可或缺的因素:数据
2、人工智能的就是把有效的数据喂给电脑,让他长成一定的智慧,实现它,就必须依靠我们的数据科学。
数据科学在人工智能中做了什么事?
能够有效的各种不同的数据源,我们能够经过清洗处理之后,做个转化,能够把它变成是机器的“粮食”。让电脑呢,可以依靠这些粮食,长成智慧,去做出进一步的决策。
数据科学能做什么?
十个字:“从数据鉴往,从数据知来”
我们要了解一个事情的轮廓,只要能取得相关的一些数据,我们就可以用比较客观的一些方式,去了解这个事件如何发生,为何发生,我们如果能给一些有效的数据,喂给一些数学模型,演算法,我们就可以让电脑掌握所谓的预知能力,让我们通过这些数据,预测未来。
数据科学需要怎样的技能?
数学与统计能力
数据科学的第一步,是建立模型,能够让电脑产生预知能力,那么建立模型就需要一些数学与统计学能力。
工程能力
在做数据分析之前,我们要收集和处理数据,那么我们就要借由很多的资讯工程,才能够把这些数据整理起来,
数据科学从业者是怎样的人呢?(我习惯于说数据科学从业者,好多20到40岁的同行们,都称呼自己为数据科学家,这个我还是不评论了)
要么是懂一点工程的统计学者
要么是懂一定统计的工程师
但是只有工程与统计还远远不够,我们还需要一定的背景知识,领域知识
领域知识
数据挖掘届最有名的案例是啤酒与尿布的案例
数据科学的一个最最重要的能力就是能辨别对于我们做出来的结果,到底是有因果关系还是只是恰好发现有关联而已。
这个图是外国的数据科学家朱康伟发表的:
数据科学家要具备怎样的能力?
第一种能力:编程能力(Hacking Skills)
只有有写程序的能力,我们才能处理数据。
第二种能力:数学与统计的能力
因为只有掌握了这种能力,我们才有办法去建模。
有写程序的能力和数学与统计能力,我们就能实现我们的算法,让电脑可以让我们收集到的数据,自动的去产生一些规则,那这样的学问,就是现在大名鼎鼎,异常火爆的机器学习
第三种能力:领域知识
拥有数学与统计学知识,与领域知识,就是传统的研究
如果拥有写程序的能力与领域知识,就是danger zone, 因为不懂数据与统计,我们可能会要一些毫无关系的东西,当作我们的结论,这时特别容易做出错误的推论。