摘要:
Turtle 库绘制浪漫场景 创建时间:2024-08-12 一、完整代码 import turtle import time # 实现清屏 def clear_screen(): turtle.penup() # 画笔抬起 turtle.goto(0, 0) # 定位到(0,0) turtle.c 阅读全文
摘要:
豆瓣影评数据抓取 创建时间:2024-08-12 抓取豆瓣影评相关数据的代码,包括封面、标题、评论内容以及影评详情页的数据。 一、完整代码 ''' https://movie.douban.com/review/best/ 抓取封面 标题 评论內容 抓取完整的评论内容 也就是点击展开后的完整的 抓取 阅读全文
摘要:
使用 Python 爬取豆瓣电影 Top250 多页数据 创建时间:2024-08-11 一、完整代码 ''' 抓取单贞数据 中的评分 简介 评价人数 将上面的改为多页 https://movie.douban.com/top250?start=0 ''' import requests from 阅读全文
摘要:
彼岸网壁纸抓取 创建时间:2024-08-11 一、代码 1.1 代码 import os import random import time import requests from lxml import etree url = 'http://pic.netbian.com/' header 阅读全文
摘要:
豆瓣短评榜单短评下载 创建时间:2024-08-07 一、完整代码 import requests from lxml import etree def get_html(main_url): header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10. 阅读全文
摘要:
按照第一列拆分excel为单独文件 创建时间:2024-08-09 一、使用方法 1.1 修改 config.json 文件里面的地址 {"excelPATH": "E:\\downloads\\无标题 (2).xls"} 修改为后面文件的具体位置 1.2 双击运行程序 二、使用实例 2.1 数据准 阅读全文
摘要:
三国演义内容抓取(诗词名句网) 时间:2024-08-06 一、完整代码 import random import time import requests from lxml import etree four_famous_novels = 'https://www.shicimingju.co 阅读全文
摘要:
中信证券抓取(页码范围) 创建时间:2024年8月5日 一、完整代码 import re import requests from lxml import etree headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x6 阅读全文
摘要:
腾牛网抓取(单页) 创建时间:2024-08-05 一、完整代码 import requests from lxml import etree url = 'https://www.qqtn.com/wm/meinvtp_1.html' header = { 'User-Agent': 'Mozil 阅读全文
摘要:
表情党抓取(单页) (网站已转移) 创建时间:2024-08-06 一、完整代码 import requests from lxml import etree url = 'https://qq.yh31.com/xq/wq/' header = { 'User-Agent': 'Mozilla/5 阅读全文