Python 按比例获取样本数据或执行任务
按比例获取样本数据或执行任务
By:授客 QQ:1033553122
开发环境
win 10
python 3.6.5
需求
已知每种分类的样本占比数,及样本总数,需要按比例获取这些分类的样本。比如,我有4种任务要执行,分别为任务A,任务B,任务C,任务D, 要求执行的总任务次数为100000,且不同分类任务执行次数占比为 A:B:C:D = 3:5:7:9,且在宏观上这些任务同时进行
代码实现
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 | #!/usr/bin/env python # -*- coding:utf-8 -*- __author__ = 'shouke' import time from copy import deepcopy def main(): class_propotion_map = { 'A' : 3 , 'B' : 5 , 'C' : 7 , 'D' : 7 } # 分类及样本数比例映射 class_list = [] # 分类 class_proption_list = [] # 存放分类样本数比例 for class_type, propotion in class_propotion_map.items(): # 同一个循环,可以保证比例索引和对应分类索引一一对应 class_list.append(class_type) class_proption_list.append(propotion) temp_class_propotion_list = deepcopy(class_proption_list) result = [] t1 = time.time() total_sample_num = 100000 #任务执行次数 for i in range ( 1 , total_sample_num + 1 ): max_propotion = max (temp_class_propotion_list) if max_propotion > 0 : index = temp_class_propotion_list.index(max_propotion) result.append(class_list[index]) temp_class_propotion_list[index] - = 1 elif max_propotion = = 0 and min (temp_class_propotion_list) = = 0 : temp_class_propotion_list = deepcopy(class_proption_list) index = temp_class_propotion_list.index( max (temp_class_propotion_list)) result.append(class_list[index]) temp_class_propotion_list[index] - = 1 t2 = time.time() from collections import Counter c = Counter(result) for item in c.items(): print (item[ 0 ], item[ 1 ] / total_sample_num) print ( '耗时:%s' % (t2 - t1)) main() |
运行结果
说明
以上方式大致实现思路就是,获取每种分类样本数所占比例副本数据列表,然后每次从中获取最大比例值,并查找该比例值对应的分类(获取分类后就可以根据需要构造、获取分类样本数据),找到目标分类后,把比例数据副本中该比例值减1,直到最大比例和最小比例都等于0,接着重置比例副本数据为样本数比例值,重复前面的过程,直到样本数达到目标样本总数,这种方式实现的前提是得提前知道样本总数及不同分类样本数所占比例,且比例值为整数
作者:授客
微信/QQ:1033553122
全国软件测试QQ交流群:7156436
Git地址:https://gitee.com/ishouke
友情提示:限于时间仓促,文中可能存在错误,欢迎指正、评论!
作者五行缺钱,如果觉得文章对您有帮助,请扫描下边的二维码打赏作者,金额随意,您的支持将是我继续创作的源动力,打赏后如有任何疑问,请联系我!!!
微信打赏
支付宝打赏 全国软件测试交流QQ群
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
2019-12-02 JavaScript 自定义html元素鼠标右键菜单