摘要:
一.逻辑回归 解决二分类问题的利器,算法自动分为0和1,比如设广告被点击为1,不被点击为0。 sigmoid函数: 1.公式 输出:[0,1]区间的概率值,默认0.5作为阀值 注:g(z)为sigmoid函数 2. 对数似然损失函数 1) cost损失的值越小,那么预测的类别准确度更高 2) 出现的 阅读全文
摘要:
一.线性回归 1.定义 线性回归通过一个或者多个自变量与因变量之间之间进行建模的回归分析。其中特点为一个或多个称为回归系数的模型参数的线性组合。 2.公式 3.损失函数 检验误差大小: 为第个训练样本的真实值 为第个训练样本特征值组合预测函数 总损失定义: 又称最小二乘法 目的是找到最小损失对应的W 阅读全文
摘要:
一.K-近邻算法 1.定义 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 2.API sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto') l 阅读全文
摘要:
一.机器学习应用场景 1)自然语言处理 2)无人驾驶 3)计算机视觉 4)推荐系统 二.特征工程 1.数据类型 1)离散型数据 由记录不同类别个体的数目所得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度。 2)连续型数据 变量可以在某个范围内取任一数, 阅读全文