05 2022 档案
摘要:# -*- coding:utf-8 -*- # Filename:test_豆瓣250.py import requests import re import csv def douban_film(): header = { "User-Agent": "Mozilla/5.0 (Macinto
阅读全文
摘要:# -*- coding:utf-8 -*- # @Time : 2022/5/17 22:22 # Author:hanyr # Filename:re模块.py import re # findall匹配字符串中所有符合正则的内容 lst = re.findall(r"\d+", "我的电话号码
阅读全文
摘要:三种解析方式 1、re解析(正则表达式) 2、bs4解析 3、xpath解析 正则表达式 Regular Expression,一种使用表达式的方式对字符串进行匹配的语法规则 优点:速度快,效率高,准确性高 缺点:难度高 正则语法:使用元字符进行排列组合用来匹配字字符串,在线测试正则表达式:http
阅读全文
摘要:# 国外路径 pip install request # 国内源镜像路径(清华) pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests import requests key=input("请输入你要查询的内容:") url
阅读全文
摘要:反爬协议查看:baidu.com/robots.txt # -*- coding:utf-8 -*- # 爬虫:通过编写程序来获取到互联网上的资源 # 需求:用程序模拟浏览器,输入一个网址,从该网址中获取到资源或内容 from urllib.request import urlopen url =
阅读全文