• 博客园logo
  • 会员
  • 周边
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






sfzyk

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

随笔分类 -  python 嵩天老师慕课笔记<机器学习应用>

 
第二周<岭回归>
摘要:传统最小二乘法缺乏稳定性 额。就是曾加正则项 \\( argmin||Xw y||^2+\alpha||w||^2 \\) 对应矩阵的求解方法为 \\(w=(X^TX+\alpha I)^{ 1}X^Ty\\) 其实就是添加正则项 sklearn.linear_model.Ridge 主要参数 + 阅读全文
posted @ 2017-05-28 22:36 sfzyk 阅读(202) 评论(0) 推荐(0)
第二周<线性回归>
摘要:可行性分析 略 sklearn.linear_model.linear_regression() 一些参数 + fit_intercept 布尔型参数,表示是否计算该模型的截距 + normalize 布尔型参数,若为TRUE,则X在回归前进行归一化,默认False 可以查看系数 linear.co 阅读全文
posted @ 2017-05-27 12:34 sfzyk 阅读(163) 评论(0) 推荐(0)
第二周<导学/分类>
摘要:分类学习 分类算法各有不同 knn naivebyes regression dnn sklearn.linear_modlel 线性函数 sklearn.preprocessing 非线性函数 分类 基本分类模型 knn sklearn.neighbors.KNeighborsClassifier 阅读全文
posted @ 2017-05-27 12:02 sfzyk 阅读(279) 评论(0) 推荐(0)
<第一周>降维
摘要:PCA 矩阵的主成分就是其协方差矩阵对应的特征向量,按照对应的特征值大小进行排序,最大的特征值为第一主成分,以此类推 主要过程 + 对所有样本进行中心化 + 计算样本的协方差矩阵 XX.T + 对协方差矩阵做特征值分解 + 取最大的几个特征向量 使用方法 sklearn sklearn.decomp 阅读全文
posted @ 2017-05-24 14:49 sfzyk 阅读(211) 评论(0) 推荐(0)
<第一周> city中国城市聚类 testdata学生上网聚类 例子
摘要:中国城市聚类 学生上网数据聚类 bdscan算法 这里有一个Silhouette coefficient是一个轮廓系数,用于评价聚类效果 阅读全文
posted @ 2017-05-22 17:14 sfzyk 阅读(330) 评论(0) 推荐(0)
第一周<单元一聚类>
摘要:K means 聚类算法 初始随机选择 而后不断更新 kmeans 应用 省份归类 调用kmeans方法所需要的参数 + n_clusters 指定的聚类中心 + init 初始聚类中心的初始化方法 默认k means++ + max_iter 最大的次数 默认300 + data 数据 + lab 阅读全文
posted @ 2017-05-19 14:11 sfzyk 阅读(155) 评论(0) 推荐(0)
第一周<导学>
摘要:导学 + 欧氏距离 平方 + 曼哈顿距离 一次方 + 马氏距离 协方差(先标准化再计算距离)\\(d(x_{i},x_{j})=\sqrt{(x_{i} x_{j})^{T}s^{ 1}(x_{i} x{j})}\\) s为数据的协方差 + 夹角余弦 sklearn cluster sklearn. 阅读全文
posted @ 2017-05-19 12:50 sfzyk 阅读(136) 评论(0) 推荐(0)
总体<导学>
摘要:有一些奇奇怪怪的数据集 波士顿房价数据集 使用 加载相关的数据集 重要参数 return_X_y 表示是否返回target (价格) 默认为False 同时返回data和target 鸢尾花数据集 类别分为三类 Iris Setosa,Iris Versicolour Iris Virginica 阅读全文
posted @ 2017-05-19 12:49 sfzyk 阅读(209) 评论(0) 推荐(0)