[置顶] 第09章 绘图和可视化

摘要: 信息可视化(也叫绘图)是数据分析中最重要的工作之一。它可能是探索过程的一部分,例如,帮助我们找出异常值、必要的数据转换、得出有关模型的idea等。另外,做一个可交互的数据可视化也许是工作的最终目标。Python有许多库进行静态或动态的数据可视化,但我这里重要关注于matplotlib(http:// 阅读全文
posted @ 2021-07-14 16:23 G-Aurora 阅读(6) 评论(0) 推荐(0) 编辑

[置顶] hive常用运算和函数 & 空值处理

摘要: 转载备查:hive常用运算和函数 - 简书 (jianshu.com) 目录第一部分:关系运算等值比较: =不等值比较: <>小于比较: <小于等于比较: <=大于等于比较: >=空值判断: IS NULL非空判断: IS NOT NULLLIKE比较: LIKEJAVA的LIKE操作: RLIKE 阅读全文
posted @ 2021-07-12 11:28 G-Aurora 阅读(87) 评论(0) 推荐(0) 编辑

[置顶] RFM模型速览

摘要: RFM模型速览 what RFM用以下指标帮助我们对用户进行分类,辅助时间精细化运营 R,最近一次消费时间 R值越小,用户价值越高 F,消费频率 F值越大,用户价值越高 M,消费金额(一段时间内,一般是30天) M值越大,用户价值越高 why 我们将F放在x轴,将R放在y轴(注意,y轴向右表示R的价 阅读全文
posted @ 2020-09-01 23:41 G-Aurora 阅读(49) 评论(0) 推荐(0) 编辑

[置顶] MySQL 8.0 窗口函数 排名、topN问题

摘要: MySQL 8.0 窗口函数 排名、topN问题 之前自己一直在用mysql5.7,没想到在8.0中加入了一个非常好用的功能 窗口函数,在这里将窗口函数、及其用法、可以解决的问题总结如下 what 窗口函数 又名OLAP函数 Online Anallytical Processing,联机分析处理 阅读全文
posted @ 2020-08-12 14:48 G-Aurora 阅读(515) 评论(0) 推荐(0) 编辑

资源位(流量)结算规则

摘要: 1.总体原则 结算总金额能够覆盖APP自身的成本和费用,实现全年整体打平 2.结算规则 流量结算 业务的使用量*单价 其他 根据实际情况的调整项 3.结算口径说明 (1)曝光UV:统计周期内,产品功能模块被曝光在视野内的用户数,日去重月加总。 (2)点击UV:统计周期内,产品功能模块有点击行为的用户 阅读全文
posted @ 2021-11-03 19:43 G-Aurora 阅读(9) 评论(0) 推荐(0) 编辑

互联网商业分析

摘要: 商业分析的产生 首先,在传统行业快速发展时,是没有商业分析的。当传统行业出现增长乏力的时候,我们需要商业分析(数据分析)来进行精细化管理。 随后,出现互联网。在互联网发展的前期,也就是红利期,通过“拍脑袋决定”也能取得增长,这时弱化了商业分析的价值。随着互联网给红利的消失,我们需要用“数据驱动决策” 阅读全文
posted @ 2021-09-10 18:26 G-Aurora 阅读(9) 评论(0) 推荐(0) 编辑

坪效

摘要: what 坪效指的是每坪面积上可以产出的营业额(1坪=3.3平方米)。也就是单门店营业面积内每平方米上所能创造的营业额。 源自台湾商业领域,是衡量一家超市或百货经营情况的重要指标。 坪效的分类 坪效 - MBA智库百科 (mbalib.com) 坪效案例 新零售关键指标“坪效”怎么用?(内附案例详解 阅读全文
posted @ 2021-09-10 15:47 G-Aurora 阅读(3) 评论(0) 推荐(0) 编辑

各类数据库中时间与日期格式的细微差别

摘要: 常用格式为:yyyy-MM-dd HH:mm:ss yyyy-MM-dd与YYYY-MM-dd区别 Y代表 Week Year,表示当天周所在的年份。这种方式将会把一年划分成52 周/53周(类似于闰年的概念,每隔几年将会增加一周)。Week Year下每周仅属于某一年,如果某年的第一周或最后一周跨 阅读全文
posted @ 2021-08-19 20:32 G-Aurora 阅读(1) 评论(0) 推荐(0) 编辑

从牛客SQL67解读 “为什么mysql5.7默认使用only_full_group_by”

摘要: 果然事件才是检验真理的唯一标准 题目链接 当初我写这道题时就准备了两种思路,常规思路和窗口函数两种。 窗口函数必然是能解的,我尝试了一下常规思路,在这个过程中我忽然明白了为什么mysql默认的sql_mode中要有一条“only_full_group_by”了 目录什么是only_full_grou 阅读全文
posted @ 2021-07-18 09:57 G-Aurora 阅读(3) 评论(0) 推荐(0) 编辑

typora+emoji

摘要: from:https://www.cnblogs.com/wangjs-jacky/p/12011208.html 目录People(小黄脸+人物)Nature(自然)ObjectPlacesSymbols People(小黄脸+人物) 😄 :smile: |😆 :laughing: 😊 :b 阅读全文
posted @ 2021-07-15 13:10 G-Aurora 阅读(1) 评论(0) 推荐(0) 编辑

plotly学习地图(持续更新)

摘要: 来吧,让我们试试在新手阶段就摆脱Matplotlib的复杂,拥抱ploty 人生苦短,我用python;同样的,人生苦短,我用ploty 官网: Plotly: The front end for ML and data science models https://plotly.com/pytho 阅读全文
posted @ 2021-07-14 17:04 G-Aurora 阅读(0) 评论(0) 推荐(0) 编辑

附录A NumPy高级应用

摘要: 在这篇附录中,我会深入NumPy库的数组计算。这会包括ndarray更内部的细节,和更高级的数组操作和算法。 本章包括了一些杂乱的章节,不需要仔细研究。 目录A.1 ndarray对象的内部机理NumPy数据类型体系A.2 高级数组操作数组重塑C和Fortran顺序数组的合并和拆分堆叠辅助类:r_和 阅读全文
posted @ 2021-07-14 16:28 G-Aurora 阅读(3) 评论(0) 推荐(0) 编辑

附录B 更多关于IPython的内容(完)

摘要: 第2章中,我们学习了IPython shell和Jupyter notebook的基础。本章中,我们会探索IPython更深层次的功能,可以从控制台或在jupyter使用。 目录B.1 使用命令历史搜索和重复使用命令历史输入和输出变量B.2 与操作系统交互Shell命令和别名目录书签系统B.3 软件 阅读全文
posted @ 2021-07-14 16:28 G-Aurora 阅读(1) 评论(0) 推荐(0) 编辑

第14章 数据分析案例

摘要: 本书正文的最后一章,我们来看一些真实世界的数据集。对于每个数据集,我们会用之前介绍的方法,从原始数据中提取有意义的内容。展示的方法适用于其它数据集,也包括你的。本章包含了一些各种各样的案例数据集,可以用来练习。 案例数据集可以在Github仓库找到,见第一章。 目录14.1 来自Bitly的USA. 阅读全文
posted @ 2021-07-14 16:27 G-Aurora 阅读(1) 评论(0) 推荐(0) 编辑