数据分析
- 提供了数据集合, 应该将他们分成两类, 一个是测试类, 一个是训练类
- 深度学习中最难的就是特征提取
- 并不是数据中的所有特征都有用的, 没有需要的使用DataFrame中的drop()去掉
- one-hot: 将string值转为int值,方便运算 --> pd.get_dummies(raw['raw_name'], prefix='my_prefix') 返回的是一个类似于真值表的表, 结果是0或者1
- 一个目标函数有3个参数, 那么梯度下降指定的对每一个系数单独求偏导, 互相不干扰
- 梯度下降的学习率就是取自变量时间隔, 一般从0.01开始, 批处理的数量是32, 64, 128, 一般64足够了
- 逻辑回归算法是最经典的算法, 套路就是先使用简单的逻辑回归, 是在不行了就是用其他复杂的算法
- sigmoid函数, g(z) = 1/(1 + e^(-z)), 它很重要, 因为它的自变量的取值范围在无穷, 而他的y的取值范围为0-1, 这就是概率的取值范围
- 线性回归的证明代一般高斯分布的公式, 逻辑回归一般代sigmoid函数的公式, 证明时遇到乘法使用log
posted @
2018-08-29 17:37
gogogo11
阅读(
138)
评论()
编辑
收藏
举报