09 2016 档案

摘要:True Positive (真正, TP)被模型预测为正的正样本; True Negative(真负 , TN)被模型预测为负的负样本 ; False Positive (假正, FP)被模型预测为正的负样本; False Negative(假负 , FN)被模型预测为负的正样本; True Po 阅读全文
posted @ 2016-09-27 15:10 白鹭倾城 阅读(4516) 评论(0) 推荐(1)
摘要:PCA作用: 降维,PCA试图在力保数据信息丢失最少的原则下,用较少的综合变量代替原本较多的变量,而且综合变量间互不相关,减少冗余以及尽量消除噪声. PCA的计算步骤: 假设样本观测数据矩阵为: , 为n个样本在第i个属性上的观测值,是一个列向量 1.对原始数据标准化处理(0均值化处理) 2.计算样 阅读全文
posted @ 2016-09-25 12:48 白鹭倾城 阅读(1934) 评论(0) 推荐(0)
摘要:CRM(客户关系管理系统)多个层级的级别依次是: (1) 建立客户个人信息档案; (2) 建立客户消费行为档案; (3) 建立客户行为轨迹档案。 客户识别 客户转化 客户分类 客户管理 客户关系 客户识别 客户转化 客户分类 客户管理 客户关系 客户管理层级示意图 客户生命周期模型: 潜伏期:当客户 阅读全文
posted @ 2016-09-21 17:33 白鹭倾城 阅读(8162) 评论(0) 推荐(0)
摘要:多元线性回归模型用途: 1、 回归用来拟合,解释现象; 2、 用来构建观测数据集与自变量之间一个预测模型; 3、 用来量化y与 相关性强度 假设: 1、 观测数据 相互独立 2、 随机误差服从于方差相同的正态分布 原理: ####R语言#################### 1、######### 阅读全文
posted @ 2016-09-17 10:45 白鹭倾城 阅读(1127) 评论(0) 推荐(0)
摘要:如何使分析框架体系化? 营销方面的理论模型有4P、用户使用行为、STP理论、SWOT等,而管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等. PEST分析理论主要用于行业分析; 4P分析理论主要用于公司整体经营情况分析; 逻辑树分析理论可用于业务问题专题分 阅读全文
posted @ 2016-09-11 18:24 白鹭倾城 阅读(2814) 评论(0) 推荐(0)
摘要:渠道流量监控中,如何将劣质流量和优质流量区分开来? 劣质流量总会有有一些不同于其他正常渠道的特征,比如在同一个时间中大量集中访问、使用的硬件设备比较固定、使用特定的浏览器等。 实际案例:去年有一些 APP 商发现,如果某个渠道出现了一大批 iPhone5C 的访问用户,可能就有问题了,因为为了以假乱 阅读全文
posted @ 2016-09-10 22:04 白鹭倾城 阅读(403) 评论(0) 推荐(0)
摘要:kmeans一般在数据分析前期使用,选取适当的k,将数据聚类后,然后研究不同聚类下数据的特点。 算法原理: (1) 随机选取k个中心点; (2) 在第j次迭代中,对于每个样本点,选取最近的中心点,归为该类; (3) 更新中心点为每类的均值; (4) j<-j+1 ,重复(2)(3)迭代更新,直至误差 阅读全文
posted @ 2016-09-04 18:06 白鹭倾城 阅读(68539) 评论(9) 推荐(2)