斯托克顿

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2020年12月11日

摘要: 最近在学习特征工程,整理了几个特征编码的方法: 方法一:合并编码(Consolidation encoding) 含义:由于拼写错误,职位、地域位置等变量的描述略有不同,可以将意思相同的分类变量映射到同一变量。 适用特征:主要处理分类变量。 优点:可以统一特征,删除无效数据 缺点:如果变量数量多,需 阅读全文
posted @ 2020-12-11 10:57 斯托克顿 阅读(340) 评论(0) 推荐(0) 编辑