2019 年 11月 20 日随笔档案 - LiYiming

2019年11月20日

摘要：在数据预处理中，我们需要采集前的数据是非常庞大的。不妨将数据集D视作一个矩阵，每一行对应一个样本，每一列对应某个特征。而在现实生活中，例如文档分类任务，以每一个字词作为一个特征，特征属性多大成千上万，即数千数万列，而相当一部分特征对于所考虑的问题具有“稀疏性”，也就是矩阵中许多列与当前学习任务无关阅读全文

posted @ 2019-11-20 20:50 LiYiming 阅读(2285) 评论(0) 推荐(0) 编辑

LiYiming

公告