机器学习之数据探索——数据特征分析(帕累托分析)
帕累托分析,即贡献度分析,在所有因素中找寻对结果起关键性或决定性作用的少部分因素。
有一常见的法则————二八定律,各行各业都在诠释着该法则的深刻含义:
例如:
1 公司的80%利润来自于20%的畅销产品,而其他80%的产品只产生了20%的利润;
2 世界上大约80%的资源是由世界上20%的人口所耗尽的;
3 世界财富的80%为20%的人所拥有;
4 20%的人口或20%的疾病,会消耗80%的医疗资源。
在一些特殊领域,二八定律可能会衍生为一九定律乃至差距更大。
在数据挖掘方面,同样需要依据二八定律的思想寻找在最大程度上影响因变量的自变量元素。
正如上例中所看到的,前7项的利润占比已经达到了80%。
特别是在商品销售方面,帕累托分析的结果可用于指导商家在商品打造上将注意力移至关键性的产品上。
作者: pythonfl
出处: http://www.cnblogs.com/pythonfl/
本文版权归作者和博客园共有,转载时请标明出处;如有疑问,欢迎联系fangleiecust@163.com;如发现文中内容侵犯到您的权利,请联系作者予以处理。