机器学习_step1_基础知识

符号约定

符号 含义
\(x\) 训练用样本值
\(x_1\) 训练用多样本矩阵
\(y\) 训练用样本标签值
\(Y\) 训练用多样本标签矩阵
\(z\) 线性运算的结果值
\(Z\) 线性运算的结果矩阵
\(δ\) 激活函数
\(α\) 激活函数结果值
\(A\) 激活函数结果矩阵
\(A1\) 第一层网络的激活函数结果矩阵
\(w\) 权重参数值
\(W\) 权重参数矩阵
\(W1\) 第一层网络权重参数矩阵
\(b\) 偏移参数值
\(b_1\) 偏移参数矩阵中的第一个偏移值
\(b2_1\) 第二层网络的偏移参数矩阵中的第1个偏移值
\(B\) 偏移参数矩阵 (向量)
\(B1\) 第一层网络的偏移参数矩阵 (向量)
\(X^T\) X的转置矩阵
\(X^\) X的逆矩阵
\(loss,loss(w,b)\) 单样本误差函数
\(J,J(w,b)\) 多样本损失函数

0 摘要

step_1 包含:

  • 人工智能发展简史、定义、以及科学范式
  • 神经网络基本的训练和工作原理
  • 反向传播和梯度下降
  • 损失函数

1 概论

1.0 人工智能发展简史

什么是智能 <图灵测试>

人工智能(Artificial Intelligence,AI)

我们总是高估一项科技所带来的短期效益,却又低估它的长期影响 ___ Roy Amara

问题:

  1. 如果一个人工智能专业的大学生毕业了,刚好遇到人工智能的“冬天”,他/她应该怎么办?
    如果一个XX专业的大学生毕业了,刚好遇到XX行业的“冬天”,他/她应该怎么办?
    
  2. 中文房间问题?
    例如:小明是一个不懂外语的人,他可以通过翻译软件与外国人交流;但这并不能证明 “小明会外语” ,仅能提供一个 “小明会外语” 的假象
    

1.1 人工智能的定义

第一层定义,人们对人工智能的期待

  • 智能的把某件特定的事情做好, 在某个领域增强人类的智慧 ___ 智能增强 (例如:搜索引擎、自助翻译) ___ "弱人工智能"、"狭义人工智能"
  • 像人类一样认知,思考,判断:模拟人类的智能 ___ 通用人工智能(Artificial General Intelligence, AGI)

第二层定义,以技术特点划分

机器学习

该技术的共性:

如果一个程序解决任务(T)的效能(用P表示)随着经验(E)增加得到了提高,那么,这个程序就能从经验(E)中学到了关于任务(T)的知识,并让衡量值(P)得到提高

  1. 选择一个模型结构(例如逻辑回归,决策树等),这就是上面说的程序
  2. 用训练数据(输入输出)输出模型,这就是上面的经验
  3. 通过不断执行任务(T)并衡量结果(P),让P不断提高,直到一个满意的标准

按 机器学习 获取经验的方式,大致分为三类:

  1. 监督学习(Supervised Learning)

    通过标注的数据来学习,例如,程序通过学习标注了正确答案的手写数字的图像数据,它就能认识其他的手写数字。

  2. 无监督学习(Unsupervised Learning)

    通过没有标注的数据来学习。这种算法可以发现数据中自然形成的共同特性(聚类),可以用来发现不同数据之间的联系,例如,买了商品A的顾客往往也购买了商品B。

  3. 强化学习(Reinforcement Learning)

    我们可以让程序选择和它的环境互动(例如玩一个游戏),环境给程序的反馈是一些“奖励”(例如游戏中获得高分),程序要学习到一个模型,能在这种环境中得到高的分数,不仅是当前局面要得到高分,而且最终的结果也要是高分才行。

M-P神经元模型

随着神经网络层次数目的增加,以非线性函数来控制相邻层次之间的输入输出,由此产生 ___ DNN(深度神经网络)

根据神经网络结构的调整,DNN逐渐演变出:CNN(卷积神经网络)、RNN(循环神经网络)、LSTM(长期短期记忆)、GAN(生成对抗网络)、Transfer Learning(迁移学习)等

训练AI模型,需要一系列专门的工具,业界成熟的训练平台(or框架)(TensorFlow、PyTorch、MXNet等)

第三层定义,应用角度

狭义人工智能取得的成果

  • 翻译领域
  • 阅读理解(SQuAD比赛)
  • 围棋、德州扑克等娱乐竞技

1.2 范式的演化

1.2.1 范式演化的四个阶段

第一阶段:经验

人类早期的科学研究,通过记录和描述自然现象的特征,来进行经验总结 ___ 经验归纳

第二阶段:理论

假设“斜面足够光滑,无摩擦力”,“空气阻力可以忽略不计” ___ 理论演算(Theoretical)

理论演算阶段要定性,定量

第三阶段:计算仿真

模拟核试验、天气预报

第四阶段:数据探索

“数据探索”(Data Exploration)

1.2.2 范式各阶段的应用

概率公式
P(A|B) = P(AB)/P(B)
P(A|B)___在B条件下 A 的概率.即事件A 在另外一个事件B已经发生条件下的发生概率。
P(AB)___事件A、B同时发生的概率,即联合概率.联合概率表示两个事件共同发生的概率.A 与 B 的联合概率表示为 P(AB) 或者 P(A,B)。

假设有三个门,只有 1 个门后有奖励,另外 2 个门后为空;你选择一个门后,有一次改变选择的机会

  1. 第一次选到中奖门的概率是多少
  2. 改变选择后选到中奖门的概率是多少
  3. 未改变选择后选到中奖门的概率是多少

理论推导

数据模拟

数据探索


今天才想起来随笔没发(弄完GitHub就把这边忘了),后续机器学习笔记就不贴了,上面链接内有完整学习规划及资料,大家共勉

posted on 2022-04-12 10:21  〆灬丶  阅读(82)  评论(6编辑  收藏  举报