Fork me on Github

05 2022 档案

摘要:1 import time 2 import requests 3 from bs4 import BeautifulSoup 4 5 index = 1 6 num = 1 7 while index <= 27: 8 header = { 9 "User-Agent": "Mozilla/5.0 阅读全文
posted @ 2022-05-29 22:42 菜鸟昂 阅读(26) 评论(0) 推荐(0) 编辑
摘要:1 import re 2 import requests 3 import csv 4 5 url = 'https://movie.douban.com/top250' 6 7 header = { 8 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; W 阅读全文
posted @ 2022-05-29 22:41 菜鸟昂 阅读(27) 评论(0) 推荐(0) 编辑
摘要:1 import requests 2 from lxml import etree 3 4 kw = input('任务关键字:') 5 url = "https://task.zbj.com/hall/list/?k={}&s=1".format(kw) 6 print(url) 7 heade 阅读全文
posted @ 2022-05-29 22:39 菜鸟昂 阅读(27) 评论(0) 推荐(0) 编辑
摘要:一、正则表达式 使用正则表达式解析页面需要引入re模块 import re 1.先写正则表达式 obj = re.compile(r'<li>.*?<span class="title">(?P<name>.*?)' r'</span>.*?<p class="">.*?<br>(?P<year>. 阅读全文
posted @ 2022-05-29 22:37 菜鸟昂 阅读(194) 评论(0) 推荐(0) 编辑
摘要:一、 爬虫:代码模拟浏览器向服务器发送请求并得到目标数据。 二、 1.get请求 1 import requests 2 3 query = input("请输入你想查询的内容:") 4 url = f"https://www.sogou.com/web?query={query}" 5 6 hea 阅读全文
posted @ 2022-05-29 21:48 菜鸟昂 阅读(27) 评论(0) 推荐(0) 编辑
摘要:模式描述 ^ 匹配字符串的开头 $ 匹配字符串的末尾。 . 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。 [...] 用来表示一组字符,单独列出:[amk] 匹配 'a','m'或'k' [^...] 不在[]中的字符:[^abc] 匹配除了a,b,c 阅读全文
posted @ 2022-05-29 21:48 菜鸟昂 阅读(22) 评论(0) 推荐(0) 编辑
摘要:@Repository和@Controller、@Service、@Component的作用差不多,都是把对象交给spring管理。 @Repository用在持久层的接口上,这个注解是将接口的一个实现类交给spring管理。 @Repository的作用: 这是因为该注解的作用不只是将类识别为Be 阅读全文
posted @ 2022-05-29 21:47 菜鸟昂 阅读(99) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示