01 2023 档案
摘要:
【题目介绍】 该题为力扣584,名为寻找用户推荐人。 【题型分类】 属于 null 专题。 官网标为简单题,有点小坑;考点为 null 值无法与确定的值作比较。 【思路分享】 方法一:not in select name from customer where id not in (select i
阅读全文

摘要:
iloc[..., ...] vs loc[..., ...] iloc:位置,数字类型 loc:标签,也可为字符类型 set_index vs reset_index set_index:原本无标签索引,现设置标签索引 reset_index:原本有标签索引,现重设标签索引 import pand
阅读全文

摘要:
题1 使用 List 构造 Series 使用 pandas,把下方数据 List,变为一个 Series,将 Series 输出到命令行 courses=['语文','数学','英语','计算机'] 题解: import pandas as pd courses=['语文','数学','英语','
阅读全文

摘要:
DA1 用 pandas 查看牛客网用户数据:读取csv文件、展示前几行数据 pd.read_csv() 读取文件,其中 dtype = object 以类似文本形式保留完整数据 df.head() 展示前几行数据 DA2 牛客网用户数据集的大小:显示数据集大小 df.shape 该属性返回元组,表
阅读全文

摘要:
【题目介绍】 该题为力扣618,名为学生地理信息报告。 【题型分类】 属于 case when 专题。 官网标为困难题,符合;其实是之前两道好题分享的变型,之前是数值类型,现在是文本型。 【思路分享】 方法一:case when 如果仅用 case when,会出现记录分散的情况,所以需要用聚合的方
阅读全文

摘要:
本节记录词云。 关键点: 1. 定义词云及其属性 wcd=WorldCloud() 2. 生成词云 wcd.generate(text) 3. 可视化词云 wcd.to_image() 4. 保存词云 wcd.to_file 注:可通过 dir() 查看词云的各种方法 dir(wcd) 脚本1:(英
阅读全文

摘要:
【题目介绍】 该题为力扣601,名为体育馆的人流量。 【题型分类】 属于连续专题。 官网标为困难题。 【思路分享】 这里的连续类似时间连续,采用 row_number() 技巧解题。 关键点: 1. 连续序列:已有连续序列,以 id 标号。 2. 不连续序列:需构造不连续序列,过滤后以 row_nu
阅读全文

摘要:
【题目介绍】 该题为力扣2173,名为最多连胜的次数。 【题型分类】 属于连续专题。 官网标为困难题。 【思路分享】 这里的连续不属于时间连续,属于事件连续,采用两次 row_number() 技巧解题。 关键点: 1. 连续序列:针对事件,缺少连续序列,用 row_number() 构造连续序列,
阅读全文

摘要:
【题目介绍】 该题为力扣1225,名为报告系统状态的连续日期。 【题型分类】 属于连续专题。 官网标为困难题。 【思路分享】 这里的连续属于时间连续,采用 row_number()、subdate() 技巧解题。 关键点: 1. 连续序列:需构造连续序列,以 row_number() 排序标号,记为
阅读全文
