摘要:
k-means聚类是处理没有目标值的数据 目的是将数据分成指定数量的类别,即“物以类聚” k-means步骤 1、随机设置K个特征空间内的点作为初始的聚类中心 2、对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别 3、接着对着标记的聚类中心之后,重新计算出每个聚类的新 阅读全文
摘要:
逻辑回归主要处理二分类问题 逻辑回归是在线性回归的基础上引入sigmoid函数 逻辑回归主要优势是可以预测二分类中,是和否的概率,例如广告点击率就是点击广告的概率和不点击广告的概率 # coding=utf-8 from sklearn.metrics import mean_squared_err 阅读全文
摘要:
# coding=utf-8 from sklearn.datasets import load_boston from sklearn.linear_model import LinearRegression,SGDRegressor,Ridge from sklearn.preprocessin 阅读全文