摘要:
用户刷卡行为数据分析: 互联网征信中的信用评分模型案例之一,分析用户刷卡行为数据,构建变量并预测结果。 1. 背景介绍 (1)个人信用贷款:结婚/家具/读书/旅行; (2)现有的网络信贷产品:芝麻信用/微粒贷/考拉信用分; (3)网络借贷: (4)信用评估:用户申请-信用评估(前后信用数据)-获得批 阅读全文
摘要:
我们拥有了数据资产,该如何对数据资产所有相关方利益进行协调和规范?本节将介绍数据治理规则、数据资产化的步骤等内容。 需要治理的,一定是存在各方利益的权衡。 1. 数据治理:就是对数据资产的治理。 什么是数据资产:资产,是指企业实际拥有或者实际控制的能够给企业带来预期经济效益的资源;数据资产,那就是拥 阅读全文
摘要:
具体的技术手段--五种常见的回归分析模型:有解释型变量X因变量Y(通过确定Y,确定Y的数据类型,来确定回归分析类型或机器学习算法) 1. 线性回归:Y是连续型数据—任何两个数据之间都可以存在一个差值,如身高体重价格收益房价等; 实际上没有完全的连续型数据,几乎都是离散型数据。 2. 0-1回归:因变 阅读全文
摘要:
如何创造价值:—— 不确定性; 只要有人有不爽的地方,就有产品需求。比如,买机票时间不同,导致票价不同,导致买到贵的票的人的不爽。 数据准备:Y+X;—— 回归分析 如机票: 因变量Y:票价; X:头脑风暴:城市人均GDP,时间,飞机城市,座舱类型等; 模型选择——预测——输出预测走势; 模型达到一 阅读全文
摘要:
回归分析:统计学用来研究不确定性的基本手段; 如何研究不确定性:分析业务——找出因变量Y——找出X; x、y、 ε表示不确定性 统计学: ——(不准确)——》 统计学就是研究不确定性 回归分析是统计学中研究数据的基本手段。 数据分析的第一步是回归分析; 回归分析的第一步是分析业务,第二步是确定因变量 阅读全文
摘要:
一. 数据的价值: 什么是价值 —— 就是在业务中最核心的诉求;(朴素的数据价值观) 数据的价值:比如,提高收入,降低成本,降低错误率; 二. 价值的体现:收入、支出、风险;—— 企业的业务中最核心的 给企业带来收入:比如,给空调厂商建议使用app控制空调,在app中可以根据数据自定义推荐和投放广告 阅读全文
摘要:
一. 什么是数据: 数据能够支持数据产业; 数据产业:数据能够支持规模化应用的产业; 规模化应用:投入-产出;产出的边际成本几乎为0; 数据就是电子化记录; 电子化记录就是数据;—— 数据依赖于记录的技术手段; 二. 数据的时代观: 数据的记录有着强烈的时代特征; 有了时代的数据处理的各种方法,才使 阅读全文
摘要:
一. 数据思维: 不确定性: 为什么要做数据分析——创造价值(创造商业价值) 分析什么:分析的不是数据,分析业务(比如分析消费者) 什么业务值得分析:带有强烈的不确定性的问题,即分析不确定性;比如天气的变化,股价的变化,消费者的购买意欲,消费者的续费意欲等; 在预测不准的情况下思考企业创新; 什么是 阅读全文
摘要:
一. 数据种类: 不可测量的数据+可测量的数据; | | 分类数据 数值数据 分类数据:数值数据之间并非相等间隔(比如天气,柔道段位等); 数值数据:数值数据之间有相等间隔(比如身高,体重,气温等); 二. 数据整体的状态(数值数据): 1. 次数分布表和直方图;组中值(中间值)、次数、相对次数(所 阅读全文
摘要:
一. 内在有偏的样本: 一个以抽样为基础的报告如果要有价值, 就必须使用具有代表性的样本, 这种样本排除了各种误差。 这就是耶鲁毕业生的收入数据失真的原因, 也是许多你在报纸或杂志上读到的报道毫无意义的原因。 无形的误差与有形的误差一样容易破坏样本的可信度。 也就是说 , 即使你找不到任何破坏性的误 阅读全文