摘要: 以设计垃圾邮件分类器为例,当我们设计机器学习算法时,先在24小时内设计出一个简单的算法,跑一遍训练数据,再根据数据的反馈结果(高偏差,高方差,或对某一类数据误判比例过高等等)调整我们的算法,反复迭代优化 一,提取特征 从大量垃圾邮件训练数据中找出出现频率最高的10,000到50,000个单词,以该单 阅读全文
posted @ 2017-04-11 23:46 蚀 阅读(274) 评论(0) 推荐(0) 编辑