摘要: Pandas 可以对 Series 与 DataFrame 进行快速的描述性统计,方便快速了解数据的集中趋势和分布差异。源Excel文件descriptive_statistics.xlsx: 一、描述性统计汇总df.describe() df.describe(percentiles=None, 阅读全文
posted @ 2021-04-20 20:06 Lu-顺 阅读(1466) 评论(0) 推荐(0) 编辑
摘要: 加载完数据后,需要对数据的全貌有所了解。源Excel文件df_info.xlsx: 一、抽样查看 df.head() # 查看前五行 df.head(8) # 查看前8条数据 df.tail() # 查看后五条数据 df.tail(8) # 查看后8条数据 df.sample() # 随机查看一条数 阅读全文
posted @ 2021-04-20 16:00 Lu-顺 阅读(780) 评论(0) 推荐(0) 编辑
摘要: 一、索引概念 “索引”类似一本书的目录(页码),通过目录(页码),让我们能快速找到想看的位置。对于一个DataFrame数据框,其中: 行索引(Label index),是一条完整数据的索引,通过这个索引,能快速取出对应的某条数据记录。 列索引(Columns Names),指向的是每一个Serie 阅读全文
posted @ 2021-04-20 01:54 Lu-顺 阅读(1640) 评论(0) 推荐(0) 编辑
摘要: 一、同期群分析概念和理论 1 同期群分析方法介绍 同期群分析(CohortAnalysis)实际上是一种用户分群的细分类型,是一种“纵横”结合的分析方法: 横向上——分析同期群随着周期推移而发生的变化; 纵向上——分析在生命周期相同阶段的群组之间的差异。 “同期群”:同一时期的群体。可以是“同一天注 阅读全文
posted @ 2021-03-25 21:21 Lu-顺 阅读(1197) 评论(1) 推荐(1) 编辑
摘要: 一、指标定义 在单位时间窗口内,多次(2次及以上)消费的用户在总消费用户的占比。 二、计算方法 ①按人数计算 所有购买过产品的顾客,以每个人为独立单位重复购买产品的次数,比如有10个客户购买了产品,5个产生了重复购买,则重复购买率为50%。 ②按交易次数计算 某月内,一共产生了100笔交易,其中有2 阅读全文
posted @ 2021-03-25 14:02 Lu-顺 阅读(1987) 评论(1) 推荐(0) 编辑
摘要: 一、函数原型 pandas.read_sql(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, columns=None, chunksize=None) 二、常用参数说明 sql:SQL命令字符串 阅读全文
posted @ 2021-03-16 09:08 Lu-顺 阅读(4168) 评论(0) 推荐(0) 编辑
摘要: pandas.read_excel()函数详解。 阅读全文
posted @ 2021-03-15 17:03 Lu-顺 阅读(4133) 评论(0) 推荐(0) 编辑
摘要: 订单销售交易数据,对企业来说其重要性,不言而喻。 阅读全文
posted @ 2021-03-13 18:21 Lu-顺 阅读(1401) 评论(0) 推荐(1) 编辑
摘要: 用实战玩转pandas数据分析(一) 阅读全文
posted @ 2021-03-12 17:47 Lu-顺 阅读(6159) 评论(2) 推荐(0) 编辑
摘要: 602. Friend Requests II: Who Has the Most Friends[M] 一、表信息 In social network like Facebook or Twitter, people send friend requests and accept others' 阅读全文
posted @ 2020-11-29 14:27 Lu-顺 阅读(195) 评论(0) 推荐(0) 编辑