摘要: 一、描述性统计描述 二、统计推断 统计学本质:用样本的统计量推断总体的参数 1、统计学的两大定理:大数定律和中心极限定理 大数定律:在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值(即总体均值)。 通俗的说就是,样本n越大,样本均值几乎等于总体均值。 阅读全文
posted @ 2020-12-13 20:03 进击的小猴子 阅读(451) 评论(0) 推荐(0) 编辑
摘要: 一、【底层逻辑】运营的核心逻辑 产品生命周期 一款产品,是不是用户数越多越好呢? 案例一,探索期的三节课:注重口碑,打造口碑传播 案例二,成长期的滴滴出行:对用户进行花式补贴 案例三,成熟期的美柚:榨取用户价值 二、【文案进阶】:提升你文案写作的核心能力 1、如何让文案讲“人话”:口语化,像哥们和闺 阅读全文
posted @ 2020-12-12 13:39 进击的小猴子 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 一、前言 1、条件概率 书写形式:P(A|B),表示在条件B下A出现的概率。 2、相关事件和独立事件 3、用好图表 二、描述统计 目的是描述数据特征,找出数据的基本规律,举例如下: 三、推断统计 统计学本质:用样本的统计量推断总体的参数 1、统计学的两大定理:大数定律和中心极限定理 大数定律:在随机 阅读全文
posted @ 2020-12-12 13:37 进击的小猴子 阅读(1873) 评论(0) 推荐(0) 编辑
摘要: 一、前言 1、条件概率 2、相关事件和独立事件 3、统计 统计是一门收集数据、处理和分析数据,解释数据并从数据中得出结论的科学。 1、描述统计:目的是描述数据特征,找出数据的基本规律,举例如下: 2、推断统计:是研究如何利用样本数据来推断总体特征的方法 参数估计实质上是样本对总体指标的估计。举例:事 阅读全文
posted @ 2020-06-24 23:38 进击的小猴子 阅读(1125) 评论(0) 推荐(0) 编辑
摘要: 一、数据波动(流量、收入、活跃数波动等) 1、确认波动是否正常:(1)检查数据来源是否真实可信;(2)和自身数据进行同比、环比,判断数据是否具有周期性;(3)和竞品数据进行对比,判断是否是行业趋势 -->判断出波动属于异常 2、外部原因猜测:PEST分析,政策、经济、社会、技术四个维度(政治变化、经 阅读全文
posted @ 2020-06-24 23:36 进击的小猴子 阅读(1996) 评论(0) 推荐(0) 编辑
摘要: 下载官网的GitHub,解压至D盘 常用参数 一、柱状图 参照 https://www.echartsjs.com/tutorial.html#%E8%87%AA%E5%AE%9A%E4%B9%89%E6%9E%84%E5%BB%BA%20ECharts 的自定义构建 ECharts 选择 http 阅读全文
posted @ 2020-01-07 13:49 进击的小猴子 阅读(396) 评论(0) 推荐(0) 编辑
摘要: 1、为什么登录用户比访问用户多? 根据客户上传的ID标记登录用户,根据访问用户的设备/cookie标记访问用户,两者是多对多的关系。 比如一个设备登录了两个账号,则登录用户+2,访问用户+1。 2、圈选指标数据只能回溯7天,怎么办? 如果是页面,可以在事件分析中通过过滤域名+页面来查询过往数据; 如 阅读全文
posted @ 2020-01-06 20:16 进击的小猴子 阅读(1145) 评论(0) 推荐(0) 编辑
摘要: 数据分析的五大问题: 是什么(量化结果,获取数据) 是多少(树立标准,评价好坏) 为什么(寻找原因,验证假设) 会怎样(综合评估,做出取舍) 又如何(预测前景,探索可能) 5W2H:人事时地因法钱 何因(Why)、何事(What)、何人(Who)、何时(When)、何地(Where)、如何做(How 阅读全文
posted @ 2019-12-31 13:44 进击的小猴子 阅读(278) 评论(0) 推荐(0) 编辑
摘要: 一、导论 【运营】是什么 二、运营的职业分工和职能发展 三、转化型文案 4个高转化率短文案的常见姿势 2个短文案写作的核心要则 中长型转化文案的写作 针对所有问题点依次进行详细解读 四、第三方推广 常见的第三方推广 第三方推广的逻辑 第三方推广的实操流程 五、微博管理 六、活动运营 1、创意 活动的 阅读全文
posted @ 2019-11-20 16:34 进击的小猴子 阅读(474) 评论(0) 推荐(0) 编辑
摘要: 一、商业分析导论 1、懂业务 2、会拆解 案例:新一线城市住房租赁市场规模 案例:2019年美国iPhone应用商店收入预估 3、重指标 问题诊断框架 1、问题界定-餐厅的销售额太差了 寻找理想态:销售额月均200万以上 2、问题拆解 3、提出假设 4、分析验证 5、结论呈现 二、经营分析 1、收入 阅读全文
posted @ 2019-11-20 16:15 进击的小猴子 阅读(1687) 评论(0) 推荐(1) 编辑
摘要: 0、导论:增长全景图 一、建立增长大局观 二、5步上线【增长实验】 1.1、评估增长的可行性——PMF分析 1、产生高质量实验假设 1.2、评估增长的重点——回答4个问题,找到增长点 2、通过ICE模型排列优先级 1.3、借鉴其他产品的增长思路 3.1、设计实验第一步:选择实验指标 2、 找到增长方 阅读全文
posted @ 2019-11-15 18:36 进击的小猴子 阅读(2557) 评论(0) 推荐(0) 编辑
摘要: 一、配置环境 在浏览器中安装web scraper插件。 所有安装包下载链接: https://pan.baidu.com/s/1CfAWf0wMO6WqicoUgdYgkg 提取码: nn2e 安装教程:http://www.iwebscraper.com/webscraper-install/ 阅读全文
posted @ 2019-11-14 17:29 进击的小猴子 阅读(725) 评论(0) 推荐(0) 编辑
摘要: 一、导论 二、市场分析 1、PEST分析 2、SWOT分析 3、价值曲线分析 互联网思维 三、竞品分析 四、用户研究 五、需求分析 MVP验证需求 六、用户体验 微信摇一摇、漂流瓶 七、产品设计 八、交互设计 九、文档规范 十、产品实现 十一、产品运营 用户运营 阅读全文
posted @ 2019-11-07 15:26 进击的小猴子 阅读(472) 评论(0) 推荐(0) 编辑
摘要: 一、统计学知识 均值、中值、众数、最大最小值、方差、标准差 1、正态分布 2、相关 如图,Y轴和X轴存在相关性,X越大,Y越大。因此花粉数量和防晒霜销量呈正相关 3、回归 二、Excel Vlookup 三、数据库 文本类型 数值类型 日期类型 1、创建、调整、删除表 #生成数据表结构 create 阅读全文
posted @ 2019-10-24 14:22 进击的小猴子 阅读(598) 评论(0) 推荐(0) 编辑
摘要: 一、基本数据类型 整型、浮点型、布尔型内容略 1、字符串的格式化 2、空值 二、数据结构 1、列表List 1.1、列表的创建 1.2、列表的基本操作 1.3、列表解析 2、元组Tuple(不可修改) 2.1、元组的创建及访问 2.2、元组的方法 3、字典Dictionary 3.1、字典的创建及访 阅读全文
posted @ 2019-08-20 17:07 进击的小猴子 阅读(2268) 评论(0) 推荐(0) 编辑
摘要: 0、数据库基础介绍 MySQL常用数据类型 数据库管理系统 DBMS(data base management system ),包括Oracle,mysql,SQLserver,MongoDB,db2等 数据库/仓库 DB SQL 结构化查询语言 Mysql 一种数据库软件,使用sql语言管理数据 阅读全文
posted @ 2019-08-17 21:44 进击的小猴子 阅读(530) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-08-15 15:03 进击的小猴子 阅读(456) 评论(0) 推荐(0) 编辑
摘要: 本文目录 一、杂 二、四大行业数据分析 1、工具 1、电商数据分析——以京东为例 2、sql常见问题 2、互联网金融——以芝麻信用为例 3、数据异常排查 3、游戏行业——以欢乐斗地主为例 4、融入专项——专题分析 4、传统销售行业 5、面试 三、具体方法论 四、专题分析标准化流程 五、数据分析师的个 阅读全文
posted @ 2019-07-23 11:52 进击的小猴子 阅读(3007) 评论(0) 推荐(0) 编辑
摘要: 一、SEO快速入门,0基础小白搭建网站 1、用好这三个工具,不懂代码也能建个“赚钱”网站 2、系统化掌握SEO理论 二、巧用搜索规律,SEO引流实操训练 核心关键词用首页优化,次级关键词用栏目页优化,长尾关键词用内容页、产品详情页优化 爆文发动机,让你的文章千万倍曝光的绝招 三、引爆流量优化技巧,让 阅读全文
posted @ 2019-05-09 21:10 进击的小猴子 阅读(440) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-05-06 21:50 进击的小猴子 阅读(1353) 评论(2) 推荐(0) 编辑
摘要: 一、了解增长和增长黑客 1、增长思维一:不同市场和企业发展阶段的增长策略 2、增长思维二:AARRR流量模型(也叫海盗指标),本质上是一种漏斗思维 示例:知乎的AARRR模型 漏斗思维在SaaS产品中的运用 3、增长团队的7步协作流程 云诺网盘7步协作案例 二、建立增长基础:验证市场可行性的5个步骤 阅读全文
posted @ 2019-04-27 15:16 进击的小猴子 阅读(828) 评论(0) 推荐(0) 编辑
摘要: 能力一:收集信息能力 能力二:沟通需求能力 能力三:定义问题能力 能力四:梳理流程能力 能力五:定义标准能力 能力六:寻找原因能力 能力七:提出建议能力 能力八:总结汇报能力 能力一:收集信息能力 七步成诗法 业务模式:挣的是什么钱 四个角色 能力二:沟通需求能力 能力三:定义问题能力 能力四:梳理 阅读全文
posted @ 2019-04-21 13:55 进击的小猴子 阅读(868) 评论(0) 推荐(0) 编辑
摘要: 前言:本文爬虫的关键字眼是“美食”,实际分析时发现“零食”的销售量远远高于“美食”,因此在一开始的数据层面就已经决定了本文分析的片面性,本篇博客主要是用于记录代码和分析过程。 实际的结论请看下一篇博客(下一篇博客爬虫的关键字眼是“零食”)。 https://www.cnblogs.com/littl 阅读全文
posted @ 2019-04-09 22:12 进击的小猴子 阅读(9563) 评论(5) 推荐(0) 编辑
摘要: 本章内容源于慕课网的《机器学习入门-经典小案例》,需要安装graphlab(它比pandas速度快,可以直接从硬盘读取大文件,pandas只能从内存中读取,pandas不适合大文件)。 graphlab只能用于python2,由于我已经装过Anaconda3了,所以在Anaconda3的基础上搭建了 阅读全文
posted @ 2019-03-14 08:49 进击的小猴子 阅读(1107) 评论(0) 推荐(0) 编辑
摘要: 一、背景和挖掘目标 二、分析方法与过程 1、数据获取 2、数据预处理 1.筛选有效问卷(根据表8-6的标准) 共发放1253份问卷,其中有效问卷数为930 2.属性规约 3.数据变换 3、模型构建 首先准备apriori.py,代码没看懂,不过可以直接调用 阅读全文
posted @ 2019-03-12 15:40 进击的小猴子 阅读(3052) 评论(0) 推荐(0) 编辑
摘要: 一、背景和挖掘目标 二、分析方法与过程 客户价值识别最常用的是RFM模型(最近消费时间间隔Recency,消费频率Frequency,消费金额Monetary) 1、EDA(探索性数据分析) 2、数据预处理 1.数据清洗 票价为空表示该值缺失,票价为0表示飞这一趟没花钱,二者概念不同 2.属性规约 阅读全文
posted @ 2019-03-06 20:41 进击的小猴子 阅读(14418) 评论(1) 推荐(1) 编辑
摘要: 一、背景与挖掘目标 相关背景自查 二、分析方法与过程 1、EDA(探索性数据分析) 1.分布分析 2.周期性分析 2、数据预处理 1.数据清洗 过滤非居民用电数据,过滤节假日用电数据(节假日用电量明显低于工作日) 2.缺失值处理 3.数据变换 以线损指标为例,可自定义为 通过这种方式,将上面各种复杂 阅读全文
posted @ 2019-03-01 11:43 进击的小猴子 阅读(4312) 评论(0) 推荐(0) 编辑
摘要: 四、关联规则 Apriori算法代码(被调函数部分没怎么看懂) 五、时序模式 以下代码全程懵逼 六、离群点检测 七、小结 阅读全文
posted @ 2019-02-28 09:39 进击的小猴子 阅读(1480) 评论(0) 推荐(0) 编辑
摘要: 一、分类和回归 回归分析研究的范围大致如下: 1、逻辑回归 2、决策树 运行上述代码,生成tree.dot文件,对其稍作修改 得到决策树的可视化 3、人工神经网络 二、评价指标 Accuracy表示你有多少比例的样本预测对了 Precision表示你预测为正的样本中有多少预测对了,又称为查准率 Re 阅读全文
posted @ 2019-01-27 20:53 进击的小猴子 阅读(1230) 评论(0) 推荐(0) 编辑
摘要: 数据预处理主要包括数据清洗、数据集成、数据变换和数据规约,处理过程如图所示。 一、数据清洗 1.缺失值处理:删除、插补、不处理 ## 拉格朗日插值代码(使用缺失值前后各5个未缺失的数据建模) 2.异常值处理 3.数据变换 1)函数变换:将不具有正态分布的数据变换成正态分布的数据 2)规范化/归一化: 阅读全文
posted @ 2019-01-22 20:50 进击的小猴子 阅读(1243) 评论(0) 推荐(1) 编辑
摘要: 1、缺失值处理:删除、插补、不处理 2、离群点分析:简单统计量分析、3σ原则(数据服从正态分布)、箱型图(最好用) 离群点(异常值)定义为小于QL-1.5IQR或大于Qu+1.5IQR 3、贡献度分析(帕累托分析,20/80定律) 4、相关性分析(以餐饮数据为例) 导入数据 求相关系数的三种方式 5 阅读全文
posted @ 2018-11-30 22:39 进击的小猴子 阅读(936) 评论(0) 推荐(0) 编辑
摘要: 《Python数据分析与挖掘实战》的数据和代码,可从“泰迪杯”竞赛网站(http://www.tipdm.org/tj/661.jhtml)下载获得 1、Python数据结构 2、Numpy数组 3、Scipy矩阵 4、Matplotlib可视化 5、Pandas数据分析和探索 Pandas基本数据 阅读全文
posted @ 2018-11-27 14:01 进击的小猴子 阅读(1094) 评论(3) 推荐(0) 编辑
摘要: 程序清单11.4~11.6(运算符重载——添加加法运算符) 程序清单11.7~11.9 只贴出与上面代码不同的地方 程序清单11.10~11.12(友元) 只贴出与上面代码不同的地方 程序清单11.13~11.15(Vector实现矢量操作:模拟随机漫步) 未完…… 阅读全文
posted @ 2018-11-19 16:05 进击的小猴子 阅读(962) 评论(0) 推荐(0) 编辑
摘要: ps:本博客内容根据唐宇迪的的机器学习经典算法 学习视频复制总结而来 http://www.abcplus.com.cn/course/83/tasks 逻辑回归 问题描述:我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录 阅读全文
posted @ 2018-01-25 20:54 进击的小猴子 阅读(877) 评论(0) 推荐(0) 编辑
摘要: 一、人脸检测并采集个人图像 运行程序,打开摄像头后会自动保存人脸图像,头不要晃动,表情变化即可,对于不合适的照片还需进行筛选。 二、基于特征脸算法的人脸识别 阅读全文
posted @ 2018-01-02 18:56 进击的小猴子 阅读(3958) 评论(0) 推荐(0) 编辑
摘要: 一、人脸识别算法之特征脸方法(Eigenface) 1、原理介绍及数据收集 特征脸方法主要是基于PCA降维实现。 详细介绍和主要思想可以参考 http://blog.csdn.net/u010006643/article/details/46417127 上述博客的人脸数据库打不开了,大家可以去下面 阅读全文
posted @ 2017-12-26 21:47 进击的小猴子 阅读(39801) 评论(0) 推荐(1) 编辑
摘要: 一、PCA理论介绍 网上已经有许多介绍pca原理的博客,这里就不重复介绍了。详情可参考 http://blog.csdn.net/zhongkelee/article/details/44064401 计算过程 数据互换 二、opencv代码 阅读全文
posted @ 2017-12-25 21:23 进击的小猴子 阅读(2029) 评论(0) 推荐(0) 编辑
摘要: 本文部分内容转自 https://www.cnblogs.com/chaosimple/p/3182157.html 一、统计学概念 二、为什么需要协方差 三、协方差矩阵 注:上述协方差矩阵还需要除以除以(n-1)。MATLAB使用cov函数计算协方差时自动除以了(n-1),opencv使用calc 阅读全文
posted @ 2017-12-25 13:26 进击的小猴子 阅读(16283) 评论(0) 推荐(3) 编辑
摘要: 全文转载自CSDN的博客(不知道怎么将CSDN的博客转到博客园,应该没这功能吧,所以直接复制全文了),转载地址如下 http://blog.csdn.net/lsq2902101015/article/details/47057081 本篇文章主要介绍了如何使用OpenCV实现人脸检测。本文不具体讲 阅读全文
posted @ 2017-12-05 15:42 进击的小猴子 阅读(1751) 评论(0) 推荐(0) 编辑
摘要: 一、取反的高级用法 二、内存(高位在高字节,低位在低字节) 三、补码 四、移位(CPU寄存器中进行计算) 1.左移 2.右移 五、微软试题 返回值为8 补充:9999如何转为2进制数 阅读全文
posted @ 2017-11-08 20:33 进击的小猴子 阅读(351) 评论(0) 推荐(0) 编辑