摘要:
一. 数据预处理 数据不平衡时,无法体现模型好坏,就像让一群硕士去做小学题,并不能区分他们的能力,宁愿把题目设置成高考题。 · 过采样和欠采样可以同时采用。 留出法的缺点:可能会导致划分在测试集内的数据有一些特征没有在训练集内发现,会有误差。 k-折交叉验证法的优点:假如划分为10个互斥子集,我们就 阅读全文
摘要:
一. 什么是机器学习 机器学习是从人工智能中产生的一个重要学科分支,是实现智能化的关键。 机器学习是一门多领域的交叉学科,设计概率论,统计学,逼近论,凸分析,算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 —— 阅读全文