摘要:
最近在查找游戏行业的数据运营和数据分析相关信息,虽然信息很多,但也不难发现游戏行业的数据分析体系与传统数据分析/互联网数据分析方法还是有很多相似的,本篇先做个阶段性总结笔记。 目前业界有两种方法论,代表性比较强的是TalkingData提出的AARRR方法论,以及由盛大倡导的PRAPA方法论;两种方 阅读全文
摘要:
SELECT curdate();-- 获取当前日期(yyyy-mm-dd) SELECT DATE_SUB(curdate(), INTERVAL 1 MONTH) as lastmonth_date; -- 获取上月同期日期(yyyy-mm-dd) SELECT date_format(DATE 阅读全文
摘要:
分类算法常见的评估指标如下: 1、混淆矩阵(Confuse Matrix) (1)若一个实例是正类,并且被预测为正类,即为真正类TP(True Positive ) (2)若一个实例是正类,但是被预测为负类,即为假负类FN(False Negative ) (3)若一个实例是负类,但是被预测为正类, 阅读全文
摘要:
Employees表: 对 Full Name 进行切割分列: 部分结果图: 把分隔后的FistName 都变成大写 结果图: 把分隔的LastName都变成小写 结果图: 引申:更多Series.str 方法详见:http://pandas.pydata.org/pandas-docs/versi 阅读全文
摘要:
student表: score表: 要求从students表里查出每个学生对应的成绩 结果图: 阅读全文
摘要:
Students.xlsx表里的数据如下: 筛选出年龄在18-30岁,且成绩在85分以上的 结果图: 分解下: 一、筛出年龄在18-30岁之间的 结果图: 二、筛出成绩在85分以上的 结果图: 阅读全文
摘要:
结果图: 阅读全文
摘要:
函数填充、计算列 结果图: 一、将"ListPrice"列 和 "Discount"列 相乘的值赋给Price 部分结果图: 二、将"ListPrice"列 +2元 后 赋给Price 部分结果图: 阅读全文
摘要:
excel表的数据情况如下:下面数据区域的左边和上边都是空,这会导致我们读取近pathon里时,结构不是我们要的,需要用到skiprow和usecols来控制我们想要读取的区域 整合: 结果图: 分解: 一、为ID列自动填充1-20的数字 : 结果图: 二、给 InStore 列 替换式的填充 YE 阅读全文
摘要:
阅读全文