06 2023 档案
摘要:import csv import urllib.request import json import time import xlwt # 》爬取评论信息《 # end_page = int(input('请输入爬取的结束页码:')) for i in range(0, end_page + 1)
阅读全文
摘要:一开始爬取的时候,没有加上请求头,所有导致会出现创宇盾进行防护,加上请求头即可 还有问题就是,这个网址的页号和网址是无关的,所以采用网上说的改变url来改变页号进行爬取是不可行的,使用 for page in range(start_page, end_page + 1): url = url.fo
阅读全文
摘要:from selenium import webdriver from selenium.webdriver.edge.service import Service import time from selenium.webdriver.common.by import By from seleni
阅读全文
摘要:一、引言 随着互联网的快速发展,大型网站已成为人们获取信息、进行交流和实现各种在线服务的重要平台。然而,大型网站的高并发、高性能和高可用性成为了设计和构建互联网应用的重要挑战。高并发要求网站能够同时处理大量用户请求,高性能要求网站能够在短时间内响应用户请求并提供快速的服务,高可用性要求网站能够在面对
阅读全文