【ShareAi】机器学习初体验

机器学习介绍

机器学习发展史

  • 人工智能(Artificial Intelligence)在1950年提出了基本概念

    起步于1950年代的贝叶斯分类器,它是基于贝叶斯决策理论,通过后验概率计算最大概率值,即为该样本预测值

    诞生于1958年的感知机模型是人工神经网络的前身,它可以看作是一种线性分类器,可以解决二分类问题,但它过于简单,甚至不能解决异或问题,因此不具有实用价值,更多的起到了思想启蒙的作用,为后面的算法奠定了思想上的基础

  • 机器学习,是发展人工智能相关技术的手段

    在1980年前,机器学习算法都是零散的,不成体系。但它们对机器学习算法的发展起到的作用不容忽视

    1980年开始,机器学习有了一个独立的发展方向,并在这个方向上,提出了很多经典机器学习算法(决策树、反向传播算法、SVM、随机森林等)

  • 深度学习,是机器学习的其中一种技术

    虽然真正意义上的人工神经网络是在1980年提出,但遗憾的是,由于受到计算能力的限制,神经网络在很长一段时间的没有得到大规模的应用。直到2010年,计算机算力的不断提高,使得深层神经网络可以得到有效的训练,深度学习算法逐步走向人工智能领域的舞台

什么是AI?人类设定好的天生本能?

这个漫画是Facebook上的一幅四格漫画,描述的是销售方对客户讲解他们生产的 "Ai" Robot,Robot可以对用户介绍商场上商品的相关信息,在它前沿科幻的外壳里面,剖开却是由一堆if判断语句构成,并不能称作真正意义上的人工智能技术

什么是机器学习?

机器学习可以抽象地看作是一个函数Function,当输入样本(图片、语音)时,Function将会输出一个预测值

而我们需要找到一个Function,输入一张图片时,该Function将会告诉我们图片里面有什么东西

首先有一个Model,里面有一系列function,在这个Model中,其中一个f1,当输入一张猫🐱图片,它就会告诉你这张图片里面含有猫;当输入一张狗🐕时它就会告诉你这张图片含有狗。但在f2中,你输入猫时它却告诉你这是一张猴子的图片,输入狗时,却告诉你这是一张蛇的图片

接下来我们要做的是,通过大量的训练数据(包含有图片和实际标签值),告诉每一个Function的输入输出值是什么样子,它们之间有什么联系。而对于一个好的function,当输入猴子🐒图片,就输出"monkey";输入猫🐱图,相应的输出"cat";输入狗🐕就输出"dog"。即说明该function比较符合此训练数据集

此任务为监督学习,即告诉机器输入和实际输出值

我们希望机器具有举一反三的能力,当输入一张没有训练过的猫🐱图片时,function f*也可以很好的输出"cat"

机器学习主要由三个过程构成,第一步我们要定义一系列function,并找到一个function;第二步让机器衡量该function在train data中是好还是不好;第三步让机器挑出最好的一个function作为该train data的判断函数

可以类比为把大象放进冰箱的三个步骤:把门打开,将大象塞进去,最后把门关起来,然后就结束了


机器学习的相关技术

  • 监督学习(回归、分类)

回归问题Regression:PM2.5预测,比如预测明天PM2.5,我们需要通过先前已知数据训练模型中一系列的function,然后找到一个性能指标好的function,而该function的输出值是未来某个时间PM2.5的数值

分类问题Classification(二分类、多分类):回归问题和分类问题最大的不同点是,回归问题输出的是一个数值,而分类问题输出的是一个类别

二分类问题:我们将一封邮件作为function的输入,其输出结果是yes/no,即判断该邮件是否为垃圾邮件

  • 半监督学习:由于人工标注需要花费很多时间,所以提出减少label需要的量,即有少量含有label的数据和大量unlabel的数据

  • 迁移学习:将某个领域或任务(源领域)上学习到的知识或模式应用到不同但相关的领域(目标领域)或问题中

比如我们将从高等数学学到的知识或者某些“特征”,然后将其应用到物理学等学科领域中,而在高等数学中学到的知识对于在物理学领域会带来什么样的帮助,这个思想就是迁移学习要将的内容

  • 无监督学习:在完全没有label的情况下,到底Model可以学到什么样的知识或者特征

比如我让模型学习一大堆关于所有动物的图片,它是否可以根据学习到的一些特征后自己构造一张关于动物的图片,类似于画一些狗🐕,有的眼睛长在身上,有的乳牛狗等等

  • 强化学习reinforcement learning:之前比较火的Alpha Go应用了强化学习+监督学习技术

期待大家早日成为Ai炼丹师-_-

posted @ 2022-01-09 16:16  .ivan  阅读(164)  评论(0编辑  收藏  举报