python学习day-11 机器学习&深度学习基本概念
一、机器学习(Machine Learning, ML)
1.1 概念:多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
1.2 学科定位:人工智能(Artificial Intelligence, AI)的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
1.3 定义:探究和开发一系列算法来如何使计算机不需要通过外部明显的指示,而可以自己通过数据来学习,建模,并且利用建好的模型和新的输入来进行预测的学科。
1.4: 学习:针对经验E (experience) 和一系列的任务 T (tasks) 和一定表现的衡量 P,如果随之经验E的积累,针对定义好的任务T可以提高表现P,就说计算机具有学习能力
1.5 机器学习的应用: 语音识别 自动驾驶 语言翻译 计算机视觉 推荐系统 无人机 识别垃圾邮件 下棋,语音识别,自动驾驶汽车等
1.6基本概念
1. 基本概念:训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类,回归
天气:晴,阴,雨
2. 概念学习:人类学习概念:鸟,车,计算机
定义:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数
3. 例子:学习 “享受运动" 这一概念:
小明进行水上运动,是否享受运动取决于很多因素
样例 | 天气 | 温度 | 湿度 | 风力 | 水温 | 预报 | 享受运动 |
1 | 晴 | 暖 | 普通 | 强 | 暖 | 一样 | 是 |
2 | 晴 | 暖 | 大 | 强 | 暖 | 一样 | 是 |
3 | 雨 | 冷 | 大 | 强 | 暖 | 变化 | 否 |
4 | 晴 | 暖 | 大 | 强 | 冷 | 变化 | 是 |
天气:晴,阴,雨
温度:暖,冷
湿度:普通,大
风力:强,弱
水温:暖,冷
预报:一样,变化
享受运动:是,否
概念定义在实例(instance)集合之上,这个集合表示为X。(X:所有可能的日子,每个日子的值由 天气,温度,湿度,风力,水温,预报6个属性表示。
待学习的概念或目标函数成为目标概念(target concept), 记做c。
c(x) = 1, 当享受运动时, c(x) = 0 当不享受运动时,c(x)也可叫做y
x: 每一个实例
X: 样例, 所有实例的集合
学习目标:f: X -> Y
4. 训练集(training set/data)/训练样例(training examples): 用来进行训练,也就是产生模型或者算法的数据集
测试集(testing set/data)/测试样例 (testing examples):用来专门进行测试已经学习好的模型或者算法的数据集
特征向量(features/feature vector):属性的集合,通常用一个向量来表示,附属于一个实例
标记(label): c(x), 实例类别的标记
正例(positive example)
反例(negative example)
5. 例子:研究美国硅谷房价
影响房价的两个重要因素:面积(平方米),学区(评分1-10)
样例 | 面积(平方米) | 学区 (11.2 深度学习(Deep Learning)介绍-10) | 房价 (1000$) |
1 | 100 | 8 | 1000 |
2 | 120 | 9 | 1300 |
3 | 60 | 6 | 800 |
4 | 80 | 9 | 1100 |
5 | 95 | 5 | 850 |
6. 分类 (classification): 目标标记为类别型数据(category) 实例1
回归(regression): 目标标记为连续性数值 (continuous numeric value) 实例2
7.
有监督学习(supervised learning): 训练集有类别标记(class label) 知道结果的
无监督学习(unsupervised learning): 无类别标记(class label) 不知道结果的
半监督学习(semi-supervised learning):有类别标记的训练集 + 无标记的训练集
8. 机器学习步骤框架
1 把数据拆分为训练集和测试集
2 用训练集和训练集的特征向量来训练算法
3 用学习来的算法运用在测试集上来评估算法 (可能要设计到调整参数(parameter tuning), 用验证集(validation set)
二、深度学习
2.1 深度学习是基于机器学习延伸出来的一个新的领域,由以人大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展,并伴随大数据和计算能力的提高而产生的一系列新的算法。深度学习,被应用在图像处理与计算机视觉,自然语言处理以及语音识别等领域
2.2 深度学习如今和未来将对我们生活造成怎样的影响?
目前我们使用的Android手机中google的语音识别,百度识图,google的图片搜索,都已经使用到了深度学习技术。Facebook在去年名为DeepFace的项目中对人脸识别的准备率第一次接近人类肉眼(97.25% vs 97.5%)。大数据时代,结合深度学习的发展在未来对我们生活的影响无法估量。保守而言,很多目前人类从事的活动都将因为深度学习和相关技术的发展被机器取代,如自动汽车驾驶,无人飞机,以及更加职能的机器人等。深度学习的发展让我们第一次看到并接近人工智能的终极目标。
2.3深度学习的应用: 无人驾驶汽车中的路标识 Google Now中的语音识别 百度识图