Python爬取中国票房网所有电影片名和演员名字,爬取齐鲁网大陆所有电视剧名称
爬取CBO中国票房网所有电影片名和演员名字
# -*- coding: utf-8 -*- # 爬取CBO中国票房网所有电影片名 import json import requests import time with open("moviename.txt", 'a') as fh: for pn in range(1,320): url = 'http://www.cbooo.cn/Mdata/getMdata_movie?area=50&type=0&year=0&initial=%E5%85%A8%E9%83%A8&pIndex=' + str(pn) print(url) time.sleep(2) try: result = requests.get(url).text jresult = json.loads(result) movices = jresult.get('pData') for movie in movices: moviename = movie.get('MovieName') print(moviename) fh.write(moviename + "\n") except: print('第'+ str(pn) + '失败!') # 爬取CBO中国票房网所有演员 import json import requests import time with open("moviestar.txt", 'a') as fh: for pn in range(1,2665): url = 'http://www.cbooo.cn/Mdata/getMdate_pList?area=50&type=0&year=0&initial=%E5%85%A8%E9%83%A8&pIndex=' + str(pn) print(url) time.sleep(2) try: result = requests.get(url).text jresult = json.loads(result) movices = jresult.get('pData') for movie in movices: moviename = movie.get('cnName') print(moviename) fh.write(moviename + "\n") except: print('第'+ str(pn) + '失败!')
爬取电视剧名称
# -*- coding: utf-8 -*- # 爬取所有电视剧名称 # 来源:齐鲁电影网 from bs4 import BeautifulSoup import urllib url = "http://www.qilumovie.com/filmclass-txt/9.html" html = urllib.request.urlopen(url).read() htmldecode = html.decode("gbk") #重点关注 soup = BeautifulSoup(htmldecode,"lxml") body = soup.body maplist = body.find_all("li") with open("tvplay.txt",'a') as fh: for tvl in maplist: tv = tvl.a.text print(tv) fh.write(tv + '\n')
如有错误,还请大侠指教一二!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具