2018 年 12月 3 日随笔档案 - WuSir_ZJ

2018年12月3日

摘要： re模块常用正则表达式符号常用匹配语法常用匹配模式 BeautifulSoup <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> </head> <body> <div cla 阅读全文

posted @ 2018-12-03 22:09 WuSir_ZJ 阅读(177) 评论(0) 推荐(0) 编辑

爬虫请求相关

摘要： urllib.request urllib.parse requests import requests response = requests.get('http://www.baidu.com/') print(response.url) print(response.text) print(r 阅读全文

posted @ 2018-12-03 21:55 WuSir_ZJ 阅读(527) 评论(0) 推荐(0) 编辑

初识爬虫

摘要：何为爬虫网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。我们平时的上网就是浏览器提交请求->下载网页代码->解析/渲染成页面。而我们的爬虫就是模拟浏览器发送请求->下载网页代码->只提取有用的数据-> 阅读全文

posted @ 2018-12-03 21:12 WuSir_ZJ 阅读(136) 评论(0) 推荐(0) 编辑

WuSir_ZJ

人一切的痛苦，本质上都是对自己无能的愤怒 --王小波

公告