摘要: 分类树(决策树)是一种十分常用的分类方法。核心任务是把数据分类到可能的对应类别。 他是一种监管学习,所谓监管学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。 决策树的理解 熵的概念对理解决策树很重要 决策 阅读全文
posted @ 2019-06-07 12:42 我的数据之路 阅读(3891) 评论(0) 推荐(0) 编辑
摘要: 这里主要从应用角度讲这三者之间的关系 在数据分析工作全流程中,统计方法主要应用在数据探索、统一分析与建模阶段 平均值、中位数等更好了解当前的数据,A/B测试检测两个数据差异是否显著等。 …… 监督学习的驱动力分析与无监督学习的分类分析 阅读全文
posted @ 2019-06-07 02:48 我的数据之路 阅读(1588) 评论(0) 推荐(0) 编辑
摘要: 一句话明晰概念:不用编程制定机器做什么,机器有能力自己学习。 三种最基础的机器学习算法:决策树、线性回归、K-means聚类。 监督与无监督学习 周志华通过敲西瓜案例有以下讲解: 监督学习是在敲西瓜听声音判断好坏过程中有懂行的人告诉你这个瓜的好坏,给不同的声音贴上了好坏瓜的标签,慢慢学习声音特征之间 阅读全文
posted @ 2019-06-07 02:11 我的数据之路 阅读(374) 评论(0) 推荐(0) 编辑