摘要: 多走前人的路,让后人少走路! 一、项目实战 电商销售数据BI报表可视化搭建 指标搭建——某APP业务指标搭建 pandas数据分析——用户消费行为分析(python) 同期群分析实现 二、sql 每日一道SQL题 SQL练习——LeetCode解题和总结(1) SQL练习——LeetCode解题和总 阅读全文
posted @ 2021-05-31 11:09 Lu-顺 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 1 查看数据类型type() 2 格式化输出str.format() 3 字符串 拼接 查找 索引 分隔、移除首位字符 4 列表 复制 合并extend() 插入新元素append()/insert() 统计值出现次数count() 获取值出现的位置index() 列表索引 删除元素pop()/re 阅读全文
posted @ 2021-07-04 16:45 Lu-顺 阅读(434) 评论(0) 推荐(0) 编辑
摘要: 数据指标定义: 对当前业务有参考价值的统计数据统计数据。没有绝对的对错,只有彼此的认同! 常见的数据指标: 一、用户相关的数据指标 1 DAU/MAU (Daily/Monthly active users) 日Daily和月Monthly计算 **日Daily:**一个自然日,(跨海产品最近24小 阅读全文
posted @ 2021-06-21 11:11 Lu-顺 阅读(1345) 评论(0) 推荐(1) 编辑
摘要: 数据源: df= pd.DataFrame({'k1': [ 's1']* 3 + ['s2']* 5,'k2' : [1, 1, 2, 3, 3, 4, 4,4]}) df 1 重复值判断和查看 df.duplicated(subset=None, keep='first') 功能: 指定列数据重 阅读全文
posted @ 2021-06-15 15:35 Lu-顺 阅读(1536) 评论(0) 推荐(0) 编辑
摘要: 一、案例场景 字段login_place,一共267725行记录,随机15条记录如下: 后续数据分析工作需要用到地理维度进行分析,所以需要把login_place字段进行拆分成:国家、省份、地区。 二、初步方案 第三方中文分词库:jieba,可以对文本进行拆分。使用参考资料:jieba库的使用。 初 阅读全文
posted @ 2021-06-15 11:55 Lu-顺 阅读(826) 评论(0) 推荐(1) 编辑
摘要: 一、time模块 time模块功能接近于操作系统层面。有些函数是平台相关的(如:time.clock()),可能会在不同的平台有不同的效果。基于Unix Timestamp,所以其所能表述的日期范围被限定在 1970 - 2038 之间。需要处理在前面所述范围之外的日期,可能需要考虑使用dateti 阅读全文
posted @ 2021-06-13 17:47 Lu-顺 阅读(468) 评论(0) 推荐(0) 编辑
摘要: 一、缺失值 1 缺失值类型 空值:在pandas中的空值是:" ",空的字符串,不是缺失值。 缺失值:pandas里,如果是DataFrame(数据帧)中,缺失值可以表示为NaN或者NaT(缺失时间)。可以用 Numpy的np.NaN/np.nan直接定义赋值缺失值。 NaN 是浮点型 针对数值为 阅读全文
posted @ 2021-06-12 10:50 Lu-顺 阅读(924) 评论(0) 推荐(0) 编辑
摘要: 一、数据指标 1 数据指标作用 让描述性统计更直观、更确定。“大概有1万多人吧” VS “2月4日新注册用户9800人,超目标1000人”。 让各部门描述口径一致。 2 指标构成 原子性指标:最基础不可拆分指标(如销售额) 修饰词(可选):某种场景(如搜索),不同维度 时间段:如618 派生指标:派 阅读全文
posted @ 2021-06-11 14:05 Lu-顺 阅读(971) 评论(0) 推荐(0) 编辑
摘要: 一、数学函数 ABS(x) --返回x的绝对值 BIN(x) --返回x的二进制(OCT返回八进制,HEX返回十六进制) CEILING(x) --返回大于x的最小整数值 EXP(x) --返回值e(自然对数的底)的x次方 FLOOR(x) --返回小于x的最大整数值 GREATEST(x1,x2, 阅读全文
posted @ 2021-06-10 18:15 Lu-顺 阅读(539) 评论(0) 推荐(1) 编辑
摘要: 一起刷题么咯? 20210610 题目: 求:NAME中每组累加/每组总数的比例大于0.6的ID和NAME。预期结果: 建表语句: CREATE TABLE T0610 ( ID INT, NAME VARCHAR ( 10 ), NUM INT ); INSERT INTO T0610 VALUE 阅读全文
posted @ 2021-06-10 17:51 Lu-顺 阅读(455) 评论(1) 推荐(0) 编辑
摘要: 一、对比思维 通过对比找到数据的变化特点和发展趋势,找到影响这种差异的原因、优化差异的方法。 (1)对比分类 指标和目标对比 目标可以是制定的目标,比如下个月计划的销售额目标。或以市场行业的平均水平作为目标。 九月份销售目标100万元,目标完成率为110%,超额完成计划目标,整体看起来不错。 与上月 阅读全文
posted @ 2021-06-10 14:05 Lu-顺 阅读(922) 评论(0) 推荐(0) 编辑