上一页 1 2 3 4 5 6 7 8 9 10 ··· 36 下一页
摘要: 一、介绍 自然排序顺序(Natural sort order)不同于默认排序,针对字符串逐个比较对应位置字符的 ASCII 码方式,更关注字符串实际相对大小意义的排序。 **例如:**需要根据年增长率(50%)对数据列进行排序,此时无法直接排序。 可以借助第三方库(natsort)进行排序。 二、n 阅读全文
posted @ 2022-04-23 23:45 Hider1214 阅读(837) 评论(0) 推荐(0) 编辑
摘要: 一、介绍 Pandas 的基础结构分为两种: 数据框 DataFrame 序列 Series 数据框(DataFame)是拥有轴标签的二维链表,类似于 Excel 中的行列关系。 列标签为列名,行标签为索引。 iterrows() 是在数据框中的行进行迭代的一个生成器,返回每行的索引以及一个包含行本 阅读全文
posted @ 2022-04-10 00:29 Hider1214 阅读(3609) 评论(0) 推荐(0) 编辑
摘要: 一、背景 近期想对比两个不同数据集的数据分布时,遇到一个问题:数据集同时包括离散、连续、时间等不同类型特征。 使用 seaborn.kdeplot 报错,仅只能针对数值型特征进行统计。 遂诞生一个需求:针对数据框,筛选指定数据类型的列。 二、select_dtypes介绍 使用语法为: data.s 阅读全文
posted @ 2022-04-05 16:43 Hider1214 阅读(3179) 评论(0) 推荐(1) 编辑
摘要: 一、安装 数据挖掘比赛最常用预测、分类模型:LGB、XGB、CatBoost、NGB、ANN等。 1.lightgbm 微软开源的 lightgbm 越来越流行。 目前比赛数据量越来越大,想要获得一个比较好的预测精度,同时又要减少内存占用以及提升训练速度,lightgbm 是一个不错的选择,其可达到 阅读全文
posted @ 2022-04-04 00:23 Hider1214 阅读(1628) 评论(2) 推荐(0) 编辑
摘要: 一、需求 例如有一个数据框列名分别为:a、b、c、d,要求转换为:d、c、b、a。 二、实操 建立测试数据集 # 建立测试数据集 df = pd.DataFrame({'a':range(5), 'b':np.random.randn(5), 'c':np.random.randn(5), 'd': 阅读全文
posted @ 2022-03-29 14:32 Hider1214 阅读(1048) 评论(0) 推荐(0) 编辑
摘要: 一、丑数 丑数(ugly number): 把只包含质因子2、3和5的数称作丑数,例如:6、8都是丑数,但7、14不是。 习惯上把1当做第一个丑数。 二、判断方法 根据丑数的定义,0和负整数一定不是丑数。 当n大于0时,如果n是丑数,那么n可以写成以下形式: n = 2^a * 3^b * 5^c 阅读全文
posted @ 2022-03-18 16:52 Hider1214 阅读(2507) 评论(0) 推荐(0) 编辑
摘要: 1.只运行1次? # 只运行一次? for i in range(4): print(i) i = 10 # 答案:运行4次,输出0123 # 原理:Python循环方式,迭代器range(4)提前被解包并赋值目标列表 2.Hash # Hash some_dict = {} some_dict[5 阅读全文
posted @ 2022-03-18 10:48 Hider1214 阅读(47) 评论(0) 推荐(0) 编辑
摘要: 一、题目 给定一个包含 [0, n] 中 n 个数的数组 nums,找出 [0, n] 这个范围内没有出现在数组中的那个数。 二、思路 1.方法一:排序 将数组排序之后,即可根据数组中每个下标处的元素是否和下标相等,得到丢失的数字。 2.方法二:哈希集合 使用哈希集合,可以将时间复杂度降低到 O(n 阅读全文
posted @ 2022-03-17 15:31 Hider1214 阅读(291) 评论(0) 推荐(0) 编辑
摘要: 一、使用datetime.quarter判断 # Python月份判断季度 import datetime import pandas as pd df['quarter'] = df['date'].dt.quarter 二、字典手动判断 data = pd.DataFrame({'month': 阅读全文
posted @ 2022-03-16 10:38 Hider1214 阅读(1118) 评论(0) 推荐(0) 编辑
摘要: 通过以下脚本,可以将程序运行时间记录,并转换为时分秒的友好格式展示。 import time from time import strftime, gmtime # 获取开始时间 start_time = time.time() ## -- 执行脚本 -- time.sleep(5) # 获取结束时 阅读全文
posted @ 2022-03-13 23:45 Hider1214 阅读(1576) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 36 下一页
点击右上角即可分享
微信分享提示