简易版爬虫（豆瓣）

import requests
import re
def get_douban():

res_str = requests.get("https://movie.douban.com/top250?start=0&filter=")

return res_str.text
def run():

resong = get_douban()

obj = re.compile('(?P<name>.*?).*?(?P<evaluate>.*?).*?'
'\\n\s+(?P<director>.*?)   ?', re.S)

ret = obj.finditer(resong)

return ret
def zuz():

for i in run():

yield{"name":i.group('name'),
"evaluate":i.group('evaluate'),
"director":i.group('director')

}
for i in zuz():

print(i)

posted @ 2017-07-04 16:28 lazy宇阅读(142) 评论(0) 编辑收藏举报

刷新页面返回顶部

lizhaoyu

简易版爬虫（豆瓣）

公告