• 博客园logo
  • 会员
  • 周边
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






江枫1

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

随笔分类 -  特征工程

 
信息增益,信息增益率
摘要:https://blog.csdn.net/u013164528/article/details/44359677 阅读全文
posted @ 2019-12-02 14:35 江枫1 阅读(290) 评论(0) 推荐(0)
PCA 降维
摘要:http://f.dataguru.cn/spark-751832-1-1.html 我们可以利用PCA算法将向量的维数降低,从而实现特征转化。具体原理在《机器学习》课程中有详细的讲述。故此处将直接介绍如何利用MLlib中的PCA算法进行特征转换。下列演示了如何计算主成分向量并实现向量降维,同时保持 阅读全文
posted @ 2017-11-03 18:00 江枫1 阅读(184) 评论(0) 推荐(0)
gain 基尼系数
摘要:转至:http://blog.csdn.net/bitcarmanlee/article/details/51488204 在信息论与概率统计学中,熵(entropy)是一个很重要的概念。在机器学习与特征工程中,熵的概念也用得灰常多。今天就把跟熵有关的东东稍微整理一下,权当笔记。 1.信息熵 熵是神 阅读全文
posted @ 2017-05-04 13:12 江枫1 阅读(750) 评论(0) 推荐(0)
特征工程、特征处理,数据清洗
摘要:http://www.cnblogs.com/fionacai/p/6159184.html 阅读全文
posted @ 2017-04-19 11:48 江枫1 阅读(181) 评论(0) 推荐(0)
特征工程
摘要:转至博文:http://www.cnblogs.com/jasonfreak/p/5448385.html 知乎问答:https://www.zhihu.com/question/29316149 归一化,正则化:http://blog.csdn.net/u012102306/article/det 阅读全文
posted @ 2016-11-04 10:12 江枫1 阅读(792) 评论(0) 推荐(0)