06 2023 档案

摘要:import csv import urllib.request import json import time import xlwt # 》爬取评论信息《 # end_page = int(input('请输入爬取的结束页码:')) for i in range(0, end_page + 1) 阅读全文
posted @ 2023-06-20 20:32 李迎辉 阅读(105) 评论(0) 推荐(0) 编辑
摘要:一开始爬取的时候,没有加上请求头,所有导致会出现创宇盾进行防护,加上请求头即可 还有问题就是,这个网址的页号和网址是无关的,所以采用网上说的改变url来改变页号进行爬取是不可行的,使用 for page in range(start_page, end_page + 1): url = url.fo 阅读全文
posted @ 2023-06-20 20:31 李迎辉 阅读(30) 评论(0) 推荐(0) 编辑
摘要:from selenium import webdriver from selenium.webdriver.edge.service import Service import time from selenium.webdriver.common.by import By from seleni 阅读全文
posted @ 2023-06-20 20:25 李迎辉 阅读(15) 评论(0) 推荐(0) 编辑
摘要:一、引言 随着互联网的快速发展,大型网站已成为人们获取信息、进行交流和实现各种在线服务的重要平台。然而,大型网站的高并发、高性能和高可用性成为了设计和构建互联网应用的重要挑战。高并发要求网站能够同时处理大量用户请求,高性能要求网站能够在短时间内响应用户请求并提供快速的服务,高可用性要求网站能够在面对 阅读全文
posted @ 2023-06-19 17:34 李迎辉 阅读(69) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示