会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
嘟嘟_猪
博客园
首页
新随笔
联系
管理
订阅
09 2016 档案
衡量分类准确度各参数含义
摘要:True Positive (真正, TP)被模型预测为正的正样本; True Negative(真负 , TN)被模型预测为负的负样本 ; False Positive (假正, FP)被模型预测为正的负样本; False Negative(假负 , FN)被模型预测为负的正样本; True Po
阅读全文
posted @
2016-09-27 15:10
白鹭倾城
阅读(4516)
评论(0)
推荐(1)
PCA理论与实践
摘要:PCA作用: 降维,PCA试图在力保数据信息丢失最少的原则下,用较少的综合变量代替原本较多的变量,而且综合变量间互不相关,减少冗余以及尽量消除噪声. PCA的计算步骤: 假设样本观测数据矩阵为: , 为n个样本在第i个属性上的观测值,是一个列向量 1.对原始数据标准化处理(0均值化处理) 2.计算样
阅读全文
posted @
2016-09-25 12:48
白鹭倾城
阅读(1934)
评论(0)
推荐(0)
深度挖掘客户价值—分析角度篇
摘要:CRM(客户关系管理系统)多个层级的级别依次是: (1) 建立客户个人信息档案; (2) 建立客户消费行为档案; (3) 建立客户行为轨迹档案。 客户识别 客户转化 客户分类 客户管理 客户关系 客户识别 客户转化 客户分类 客户管理 客户关系 客户管理层级示意图 客户生命周期模型: 潜伏期:当客户
阅读全文
posted @
2016-09-21 17:33
白鹭倾城
阅读(8162)
评论(0)
推荐(0)
多元线性回归理论与实践
摘要:多元线性回归模型用途: 1、 回归用来拟合,解释现象; 2、 用来构建观测数据集与自变量之间一个预测模型; 3、 用来量化y与 相关性强度 假设: 1、 观测数据 相互独立 2、 随机误差服从于方差相同的正态分布 原理: ####R语言#################### 1、#########
阅读全文
posted @
2016-09-17 10:45
白鹭倾城
阅读(1127)
评论(0)
推荐(0)
数据分析框架
摘要:如何使分析框架体系化? 营销方面的理论模型有4P、用户使用行为、STP理论、SWOT等,而管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等. PEST分析理论主要用于行业分析; 4P分析理论主要用于公司整体经营情况分析; 逻辑树分析理论可用于业务问题专题分
阅读全文
posted @
2016-09-11 18:24
白鹭倾城
阅读(2814)
评论(0)
推荐(0)
Growing转化的每一步(笔记整理)
摘要:渠道流量监控中,如何将劣质流量和优质流量区分开来? 劣质流量总会有有一些不同于其他正常渠道的特征,比如在同一个时间中大量集中访问、使用的硬件设备比较固定、使用特定的浏览器等。 实际案例:去年有一些 APP 商发现,如果某个渠道出现了一大批 iPhone5C 的访问用户,可能就有问题了,因为为了以假乱
阅读全文
posted @
2016-09-10 22:04
白鹭倾城
阅读(403)
评论(0)
推荐(0)
kmeans算法原理以及实践操作(多种k值确定以及如何选取初始点方法)
摘要:kmeans一般在数据分析前期使用,选取适当的k,将数据聚类后,然后研究不同聚类下数据的特点。 算法原理: (1) 随机选取k个中心点; (2) 在第j次迭代中,对于每个样本点,选取最近的中心点,归为该类; (3) 更新中心点为每类的均值; (4) j<-j+1 ,重复(2)(3)迭代更新,直至误差
阅读全文
posted @
2016-09-04 18:06
白鹭倾城
阅读(68539)
评论(9)
推荐(2)
公告