Lecture 1 -- Preparation

1. 机器学习的任务

Machine Learning ≈ Looking for Function (⭐)

Regression: The function outputs a scalar
Classification: Given options (classes), the function outputs the correct one
Structured Learning: Creat something with structured (image, document) -- “让机器学会创造”

Step 1: Define a Function with Unknown Parameters (Model) -- Based on domain knowledge

Step 2: Define Loss from Training Data

Step 3: Optimization w, b

$w^*,b^*=\underset{w,b}{argmin}L$
Gradient Desent (⭐)
- (Randomly) Pick an initial values $w^0,b^0$
- Compute:

$$\displaystyle\frac{\partial L}{\partial w}|{w=w^0, b=b^0}$$

$$\displaystyle\frac{\partial L}{\partial b}|{w=w^0, b=b^0}$$

$$w^1\gets w^0-\eta \displaystyle\frac{\partial L}{\partial w}|{w=w^0, b=b^0}$$

$$b^1\gets b^0-\eta \displaystyle\frac{\partial L}{\partial b}|{w=w^0, b=b^0}$$

总结：搭建模型 --> 前向传播 --> 计算损失 --> 反向传播 --> 更新参数

Linear models are too simple！图中的红色曲线(Piecewise Linear Curve)显然无法用线性模型拟合！线性模型很明显存在Model Bias！这种情况我们应该怎么办？

通常使用Sigmoid函数，如下图所示。

因此，3.2中的Red Curve: $y=b+\displaystyle\sum_i{c_isigmoid\left( w_{\text{i}}\text{x}+\text{b}_{\text{i}} \right)}$
推广到j个特征，$y=b+\displaystyle\sum_i{c_isigmoid\left( \displaystyle\sum_{\text{j}}{\text{w}_{\text{ij}}\text{x}_{\text{j}}}+\text{b}_{\text{i}} \right)}$

END

posted @ 2023-07-15 16:31 Peg_Wu 阅读(11) 评论(0) 编辑收藏举报

刷新页面返回顶部