【July】【Machine Leraning】1.微积分和概率论

1. 两边夹定理

  • 形象化解释
    • 单位圆,半径 = 1
    • BC线段( sin x) < AB线段 < AB弧( x) <AD线段
    • 可以得到

    • 求极限
    • 得到
  • 例子,求解
    = 3/2

2. 极限存在定理

  • 数列如果单调递增有上界,则一定有极限
  • 二项式展开定理
  • 考察一个数列
    • 由此可见,这个数列是个递增数列 且 小于3
    • 可以推断,这个数列的极限也应当小于3,大于2,用符号e作为记号
  • 如果n取实数,而不是整数.
    • 构造不等式
    • 左侧和右侧分别求极限
    • 根据两边夹定理,可以得到

3. 导数

  • 一阶导数:曲线的斜率 => 曲线变化快慢
  • 二阶导数:斜率的变化快慢 => 曲线的凸凹性
  • 物理:加速度是二阶导数,且导数方向在曲线凹的一侧
  • 常用导数的求解
  • 应用,求解函数的最小值
    • 核心是利用两侧取对数导数 = 0的策略来求解

4. Taylor 和 Maclaurin 公式

  • Taylor基本公式
    • x0点展开
    • 展开到n项,加上高阶无穷小
  • 如果要求在x0=0处展开,则得到Maclaurin公式
  • 对复杂函数,求解函数在原点展开
    • 如果一个函数求解有困难,通过展开可以得到多项式加权的和
  • 实际过程中需要改进
    • 整数+小数来表达一个实数

    • 第一项可以计算,第二项一定是收敛的
  • 应用,分析熵的函数
    • f(x)=lnxx=1一阶展开,可以得到f(x)=1x
    • 则熵函数可以写为

5. 方向导数

  • 函数f(x)在任意方向L的导数,φ是L与x轴方向夹角

  • 梯度grad f(x),高程变化最快的方向,抛去cos,sin函数

6. 凸函数

  • 形象化解释

    • 不等式左侧,是曲线上一点
    • 不等式右侧,是直线上一点
    • 直线上一点 > 曲线上一点
    • 割线在上,函数在下 => 凸函数
  • 判定方法

  • 拓展更多维度,得到不等式
  • 例子,完成证明


7. 概率论

7.1 概率的基本定义


- 事件一定发生 => P(X) = 1,反之不一定成立
- 事件一定不发生 => P(X) = 0,反之不一定成立
- 即概率 = 0,不意味着不可能发生
- 离散 => 概率
- 连续变量 => 概率密度

7.2 累积分布函数


- 给出f(x),值域是[0,1] => 累计概率 => 求导,得到概率密度(Logistic回归)

  • CDF: Cumulative Distribution Function,累计分布函数
  • PDF: Probability Density Function,概率密度函数

7.3 例子:古典概型基本思路

  • 例子
    • 算所有概型个数
    • 算有效事件个数
    • 两者相除即可得到结论
  • 转化为另外一个例题,生日悖论

7.4 组合数 - 装箱问题

  • 例子
    • 全部事件
    • 有效事件
      3! 次品摆放
      正品摆放
  • 组合数关系
    • n:物品总数
    • k:组的类别
    • n_k: 每组个数
  • 进一步,如果明确 n = 2

7.5 商品推荐 - 几何概型

  • A商品匹配度0.8,B商品匹配度0.2
  • 系统随机为A生成在[0, 0.8]的均匀分布
  • 系统随机为B生成在[0, 0.2]的均匀分布
  • 系统全局为0.8*0.2的一个矩形,画一条A=B的直线,进行切割

7.6 概率公式总结

7.7 Bayes公式的应用

  • 是否校准
  • 校准和中靶结合
  • 校准|中靶

7.8 两个学派

  • 给定系统样本 => 求解系统该参数
    • 矩估计
    • MLE,MaxEnt, EM
    • 频率学派
  • 贝叶斯模型
    • 参数本身变化,服从某个分布
    • 在分布约束下 => 目标函数极大极小

7.9 Bayes公式分析

  • 先验概率:没有任何其他信息支撑
  • 后验概率:已知数据的情况下
  • 似然函数:给定概率分布 + 参数,求时间发生的概率

7.10 分布

  • Possion分布
    将e^x的展开式处理

    • 处理汽车站候车人数,自然灾害发生
    • 即事件以平均瞬时速率λ随机独立出现,则在单位时间出现的次数 => Possion分布
  • 指数分布

    • 无记忆效应
  • 总结

  • 用指数族 - exponential family来表达

  • Logistic - Sigmond 函数

  • 函数递增
  • 值域[0, 1]
  • 神经网络的激活函数
  • 求导数

  • Gamma函数

    • Gamma函数是阶乘的推广
posted @ 2016-03-03 08:52  Frankww  阅读(366)  评论(0编辑  收藏  举报