摘要: 拿电商行业举例,经常会遇到以下问题:如果基于商品的历史销售情况,以及节假日、气候、竞争对手等影响因素,对商品的销量进行趋势预测?如何预测未来一段时间哪些客户会流失,哪些客户可能会成为VIP用户?如果预测一种新商品的销售量,以及哪种类型的客户会比较喜欢?除此之外,运营部门需要通过数据分析来了解具有某些特征的客户的消费习惯,管理人员希望了解下一个月的销售收入等,这些都是分类与预测的日志。分类和预测是预... 阅读全文
posted @ 2020-01-30 16:54 斜杠代码日记 阅读(1010) 评论(0) 推荐(0) 编辑
摘要: 决策树在分类、预测、规则提取等领域有着广泛的应用。决策树是一种树状结果,它的每一个叶节点对应一个分类。构造决策树的核心问题是:在每一步如何选择适当的属性对样本做拆分。对于分类问题,从已知类标记的训练样本中学习并构造出决策树是一个自上而下,分而治之的过程。常见的决策树算法如下:ID3算法C4.5算法C 阅读全文
posted @ 2020-01-30 16:49 斜杠代码日记 阅读(912) 评论(0) 推荐(0) 编辑
摘要: 对数据质量进行简单的分析后,我们就可以开始来分析数据的特征分析了。数据的特征分析可以从以下几个方面开展:分布分析对比分析统计量分析周期性分析相关性分析通过以上5种方式,可以找到数据中存在的某种特征。分布分析分布分析很容易理解,就是理解数据的分布情况。例如:在0-100区间有多少数据、100-1000 阅读全文
posted @ 2020-01-30 11:25 斜杠代码日记 阅读(1307) 评论(0) 推荐(0) 编辑