随笔分类 - python爬虫
摘要:1、re正则解析:开源中国的正则测试学习链接:https://tool.oschina.net/regex# 菜鸟课程的正则:https://www.runoob.com/regexp/regexp-syntax.html 1、re模块在python中的使用 # 导入正则模块 import re 1
阅读全文
摘要:1、第一个爬虫程序 # 爬虫:通过编写程序来获取到互联网上的资源 # 百度 # 需求:用程序模拟浏览器.输入一个网址,从该网址中获取到资源或者内容 # python搞定以上需求 from urllib.request import urlopen # url = 'http://www.baidu.
阅读全文