多线程 - lynn_chen

主线程 --- 默认有个主线程
子线程 --- 主线程启动子线程

import threading,time

def run():
　　# time.sleep(3)
　　print('hahahah')

for i in range(5):
　　t = threading.Thread(target=run) #实例化了一个线程
　　t.start()
　　# run()

***多线程，就是 N 个线程一起在干活（并发） --- N 就是上面的循环次数

例：写一个实现爬虫功能的代码，给一个 url 字典，k为保存爬取信息的文件名，v 为 url 地址

方法一、串行（单线程）
import requests,time

urls = {
　　'besttest':'http://www.besttest.cn',
　　'niuniu':'http://www.nnzhp.cn',
　　'dsx':'http://www.imdsx.cn',
　　'cc':'http://www.cc-na.cn'
　　}

def down_html(file_name,url):
　　res = requests.get(url).content
　　open(file_name+'.html','wb').write(res)

start_time = time.time()
for k,v in urls.items():
　　down_html(k,v)
end_time = time.time()
run_time = end_time - start_time
print('下载总共花了xxx时间',run_time)

方法二、并行（多线程） ---- 运行结果不符，因为记得是主线程的运行时间，而主线程只是启动了子线程，未等待子线程执行结束（线程等待请参考博客另一篇随笔）

import requests,time,threading

urls = {
　　'besttest':'http://www.besttest.cn',
　　'niuniu':'http://www.nnzhp.cn',
　　'dsx':'http://www.imdsx.cn',
　　'cc':'http://www.cc-na.cn',
　　'alin':'http://www.limlhome.cn'
　　}

def down_html(file_name,url):
　　res = requests.get(url).content
　　open(file_name+'.html','wb').write(res)

start_time = time.time()
for k,v in urls.items():
　　t = threading.Thread(target=down_html,args=(k,v)) #多线程的函数传参的话，必须得用 args
　　t.start() #主线程启动线程后，自动走下一步代码，不会等线程执行完
end_time = time.time()
run_time = end_time - start_time
print('下载总共花了xxx时间',run_time) #该打印的时间是主线程运行的时间

**************************************
线程与线程之间运行是独立的；上述一共有 6 个线程，其中包括一个主线程，用于线程的启动
*** 进程里面默认有一个线程，这个线程叫做主线程

发表于 2018-05-31 17:38 lynn_chen 阅读(74) 评论(0) 收藏举报