摘要:
1 pd.concat()轴连接合并 pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=Fals 阅读全文
摘要:
一、项目背景 深圳某初创公司业务——做短视频领域的内容分发。下图是业务大概模式: 用户积累到一定量后,业务数据数据量达到一定规模。项目合伙人需要量化业务的发展状况,监控业务数据的变化情况。现在需求如下: 建立全方位业务指标体系 搭建可视化看盘报表 二、产品逻辑 内容分发类的产品的逻辑可以简单看成一个 阅读全文
摘要:
多走前人的路,让后人少走路! 一、项目实战 电商销售数据BI报表可视化搭建 指标搭建——某APP业务指标搭建 pandas数据分析——用户消费行为分析(python) 同期群分析实现 二、sql 每日一道SQL题 SQL练习——LeetCode解题和总结(1) SQL练习——LeetCode解题和总 阅读全文
摘要:
一、术语 1.1 总体和样本,参数和统计量 总体(population): 样本:总体的子集 参数(parameter):总体数据计算的值,适用于总体 统计量(statistic):样本数据计算的值 描述统计(descriptive):描述收集数据样本或总体的信息 推断统计(inferential) 阅读全文
摘要:
一个数据框包含索引和数据,可以对索引和数据进行操作。原始数据框: # 数据 index = [['a','a','b','b'],[1,2,3,4],[4,3,2,1]] dict = { '姓名':['任*','江*','陈*','罗*'], '数学':[67,81,81,62], '语文':[7 阅读全文
摘要:
源Excel文件pandas_sort.xlsx: 一、索引排序df.sort_index() df.sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', 阅读全文
摘要:
不同的数据类型可以用不同的处理方法。合适的数据类型,才能更高效处理数据。一个列只能有一个总数据类型,但具体值可以是不同的数据类型。源Excel文件pandas_dtypes.csv: df = pd.read_csv(r"pandas_dtypes.csv") df df.dtypes # Cust 阅读全文
摘要:
一、题目 题目信息:“订单信息表”记录了巴西乘客使用打车软件的信息,包括订单呼叫、应答、取消、完单时间。(滴滴2020数据分析面试题) 字段信息: order_id:订单ID,呼叫订单识别号 passenger_id:乘客ID,乘客识别号 call_time:呼叫时间,乘客从应用上发出需要用车的请求 阅读全文
摘要:
数据筛选是处理数据的重要一步。源Excel文件Fancy_Indexing.xlsx: df = pd.read_excel(r'C:/Users/asus/Desktop/Python/Fancy_Indexing.xlsx') df 一、截断操作df.truncate() df.truncate 阅读全文
摘要:
除了对原始数据进行简单的统计计算外,有时候我们还需要对数据进行一定变化再做计算。pandas自带一些基础函数支持这些变化。源Excel文件maths_pro.xlsx: 一、位移增量df.diff()和位移操作df.shift() ①df.shift() df.shift(periods=1, fr 阅读全文