python获取网页精准爬取数据

import re
import urllib.request
string='<div class="name">(.*?)</div>'
huo=urllib.request.urlopen("https://read.douban.com/provider/all").read()
huo=huo.decode("utf-8")
huo1=re.compile(string).findall(str(huo))
hom=open('D:\hom.txt','w')
hom.write(str(huo1))
hom.close()

简单易了

posted @ 2018-05-17 19:25  纯情  阅读(163)  评论(0编辑  收藏  举报