摘要: 最近在查找游戏行业的数据运营和数据分析相关信息,虽然信息很多,但也不难发现游戏行业的数据分析体系与传统数据分析/互联网数据分析方法还是有很多相似的,本篇先做个阶段性总结笔记。 目前业界有两种方法论,代表性比较强的是TalkingData提出的AARRR方法论,以及由盛大倡导的PRAPA方法论;两种方 阅读全文
posted @ 2023-02-20 15:31 后来的后来123 阅读(234) 评论(0) 推荐(0) 编辑
摘要: SELECT curdate();-- 获取当前日期(yyyy-mm-dd) SELECT DATE_SUB(curdate(), INTERVAL 1 MONTH) as lastmonth_date; -- 获取上月同期日期(yyyy-mm-dd) SELECT date_format(DATE 阅读全文
posted @ 2022-10-11 15:04 后来的后来123 阅读(1479) 评论(0) 推荐(0) 编辑
摘要: 分类算法常见的评估指标如下: 1、混淆矩阵(Confuse Matrix) (1)若一个实例是正类,并且被预测为正类,即为真正类TP(True Positive ) (2)若一个实例是正类,但是被预测为负类,即为假负类FN(False Negative ) (3)若一个实例是负类,但是被预测为正类, 阅读全文
posted @ 2020-09-15 17:45 后来的后来123 阅读(628) 评论(0) 推荐(0) 编辑
摘要: Employees表: 对 Full Name 进行切割分列: 部分结果图: 把分隔后的FistName 都变成大写 结果图: 把分隔的LastName都变成小写 结果图: 引申:更多Series.str 方法详见:http://pandas.pydata.org/pandas-docs/versi 阅读全文
posted @ 2019-05-03 01:06 后来的后来123 阅读(10811) 评论(0) 推荐(1) 编辑
摘要: student表: score表: 要求从students表里查出每个学生对应的成绩 结果图: 阅读全文
posted @ 2019-05-03 00:10 后来的后来123 阅读(11764) 评论(0) 推荐(0) 编辑
摘要: Students.xlsx表里的数据如下: 筛选出年龄在18-30岁,且成绩在85分以上的 结果图: 分解下: 一、筛出年龄在18-30岁之间的 结果图: 二、筛出成绩在85分以上的 结果图: 阅读全文
posted @ 2019-05-02 23:18 后来的后来123 阅读(798) 评论(0) 推荐(0) 编辑
摘要: 结果图: 阅读全文
posted @ 2019-05-02 22:44 后来的后来123 阅读(8621) 评论(0) 推荐(0) 编辑
摘要: 函数填充、计算列 结果图: 一、将"ListPrice"列 和 "Discount"列 相乘的值赋给Price 部分结果图: 二、将"ListPrice"列 +2元 后 赋给Price 部分结果图: 阅读全文
posted @ 2019-05-02 18:50 后来的后来123 阅读(3208) 评论(0) 推荐(0) 编辑
摘要: excel表的数据情况如下:下面数据区域的左边和上边都是空,这会导致我们读取近pathon里时,结构不是我们要的,需要用到skiprow和usecols来控制我们想要读取的区域 整合: 结果图: 分解: 一、为ID列自动填充1-20的数字 : 结果图: 二、给 InStore 列 替换式的填充 YE 阅读全文
posted @ 2019-05-02 17:49 后来的后来123 阅读(7248) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-05-02 00:14 后来的后来123 阅读(2249) 评论(0) 推荐(0) 编辑