参考自定义线程池:https://www.cnblogs.com/zhang293/p/7954353.html

 

 

原密解析: https://www.jianshu.com/p/b9b3d66aa0be

 

最佳线程数的获取:

1、通过用户慢慢递增来进行性能压测,观察QPS(即每秒的响应请求数,也即是最大吞吐能力。),响应时间

2、根据公式计算:服务器端最佳线程数量=((线程等待时间+线程cpu时间)/线程cpu时间) * cpu数量

3、单用户压测,查看CPU的消耗,然后直接乘以百分比,再进行压测,一般这个值的附近应该就是最佳线程数量。

 

方式 1 :(推荐)

 线程的监听:

 

from concurrent.futures import ThreadPoolExecutor
pools = ThreadPoolExecutor(5)
def testKafkaConsumerMutil():
    consumer = KafkaConsumer("Sea",bootstrap_servers = ['192.168.18.129:9092'],
                        group_id ='test0',
                        auto_offset_reset ='earliest',
                        max_poll_records=100,
                        consumer_timeout_ms=30000,
                        session_timeout_ms=30000, 
                        enable_auto_commit =False)
    for msg in consumer:
        offset = msg.offset
        print("offset"+str(offset))
        data= json.loads(msg.value)
        pools.submit(printt,data)
        #监听当前线程池的线程数量
        print("qsize"+str(pools._work_queue.qsize()))
        if pools._work_queue.qsize()>=6:
            pass
            time.sleep(30)
        consumer.commit()



def printt(value):
#     print(value)
    time.sleep(2)
    pass

 

 

 

ThreadPoolExecutor  返回为future(T)
'''
Created on 2019年10月11日

@author: sea
'''
# -*- coding: utf-8 -*-
from concurrent.futures import ThreadPoolExecutor
import time
from com.sea.email.MailUtils import send
'''
ThreadPoolExecutor中的submit()
<T> Future<T> submit(Callable<T> callable);
<T> Future<T> submit(Runnable var1, T result);
Future<?> submit(Runnable runnable);
'''
print(" 线程池 ThreadPoolExecutor 的使用")
def sayhello(a):
    print("hello  "+a)
#     time.sleep(1)
    return "结果 nihao : "+a



def test1():#submit()
    pool = ThreadPoolExecutor(3)
    submit1 = pool.submit(sayhello,("sea"))  #方法名 ,参数() 如果有多个参数,直接写多个就好,eg : say(a,b)----->pool.submit(say,"aaa","bbb")
#     submit1 = pool.submit(sayhello,"sea")  #方法名 ,参数()

    submit2 = pool.submit(sayhello,("sea2"))
    submit3 = pool.submit(sayhello,("sea3"))
    submit4 = pool.submit(sayhello,("sea4"))
    
    print(submit4.result())#打印应返回值  阻塞-直到返回结果
    print(submit1.result())
    print(submit2.result())
    print(submit3.result())
    print("over")

def test2():#map() 
    seed=["a","b","c"]
    pool = ThreadPoolExecutor(3)
    rsultList = pool.map(sayhello,seed)#返回值为list 结果集
    for result in rsultList:
        print(result)#打印应返回值
    print("over")

#     with ThreadPoolExecutor(3) as executor1:
#         executor1.map(sayhello,seed)
if __name__ == '__main__':
#     test1()
    test2()
    
    
  

 

 

concurrent.futures.ThreadPoolExecutor,在提交任务的时候,有两种方式,一种是submit()函数,另一种是map()函数,两者的主要区别在于:

2.1、map可以保证输出的顺序, submit输出的顺序是乱的

2.2、如果你要提交的任务的函数是一样的,就可以简化成map。但是假如提交的任务函数是不一样的,或者执行的过程之可能出现异常(使用map执行过程中发现问题会直接抛出错误)就要用到submit()

2.3、submit和map的参数是不同的,submit每次都需要提交一个目标函数和对应的参数,map只需要提交一次目标函数,目标函数的参数放在一个迭代器(列表,字典)里就可以。

3.现在?

这里要考虑一个问题,以上两种线程池的实现都是封装好的,任务只能在线程池初始化的时候添加一次,那么,假设我现在有这样一个需求,需要在线程池运行时,再往里面添加新的任务(注意,是新任务,不是新线程),那么要怎么办?

 

 

 

 

 

方式2 :python3的vthread库
可以试试python3的vthread库
import vthread

@vthread.pool(6)
def some(a,b,c):
    import time;time.sleep(1)
    print(a+b+c)

for i in range(10):
    some(i,i,i)

分组线程池
import vthread

@vthread.pool(6)
def some1(a,b,c):
    import time;time.sleep(1)
    print("some1",a+b+c)

@vthread.pool(3,1)
def some2(a,b,c):
    import time;time.sleep(1)
    print("some2",a*b*c)

for i in range(10):
    some1(i,i,i)
    some2(i,i,i)

加锁或其他操作,help()一下基本就能看懂。

 

 

 

方式3 :(比较老)

使用threadpool模块  具体使用方式如下:

#! /usr/bin/env python
# -*- coding: utf-8 -*-

import threadpool
import time

def sayhello (a):
    print("hello: "+a)
    time.sleep(2)

def main():
    global result
    seed=["a","b","c"]
    start=time.time()
    task_pool=threadpool.ThreadPool(5)
    requests=threadpool.makeRequests(sayhello,seed)
    for req in requests:
        task_pool.putRequest(req)
    task_pool.wait()
    end=time.time()
    time_m = end-start
    print("time: "+str(time_m))
    start1=time.time()
    for each in seed:
        sayhello(each)
    end1=time.time()
    print("time1: "+str(end1-start1))

if __name__ == '__main__':
    main()

 

posted on 2019-10-11 15:29  lshan  阅读(714)  评论(0编辑  收藏  举报