摘要: 头文件 from bs4 import Beautifulsoup 编译器(不太懂html): 似乎有lxml和html.parser?(一个用不了用另一个)lxml似乎要先下载 自动识别文件编码形式并转换文件内容: from bs4 import UnicodeDammit dammit=Unic 阅读全文
posted @ 2020-03-04 09:46 Sakura_Momoko 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 多线程 用不了多核!IO密集优势更大(比如下载文件啊...) 一般的python程序都是前台运行(主线程),即代表了顺序运行只有前面一个运行完毕后才能运行后面一个,但这样有时候会很浪费时间,比如下载两个数据第一个数据单独下载耗时t1而第二个单独下载耗时t2,时间是t1+t2,但是你将这个两个程序放入 阅读全文
posted @ 2020-03-04 09:40 Sakura_Momoko 阅读(207) 评论(0) 推荐(0) 编辑