爬虫-正则表达式

import requests
import re

content =  requests.get('https://book.douban.com').text
#partten = re.compile('<li.*?cover.*?href="(.*?)".*?title="(.*?)".*?</li>',re.S)
partten = re.compile('<li.*?cover.*?title="(.*?)".*?more-meta.*?author">(.*?)</span>.*?year">(.*?)</span>.*?</li>',re.S)
results = re.findall(partten,content)
for result in results:
    name,author,date = result
    #author = re.sub('\s','',author)
    #date = re.sub('\s','',date)
    print(name,author.strip(),date.strip())

posted @ 2018-11-29 18:18 大漠之烟阅读(190) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

大漠之烟

爬虫-正则表达式

公告