Python爬取腾讯视频电影名称和链接(一)
1 import requests
2 import json
3 from bs4 import BeautifulSoup #网页解析获取数据
4 import sys
5 import re
6 import urllib.request,urllib.error #制定url,获取网页数据
7 import sqlite3
8 import xlwt #excel操作
9
10 def get_ten():
11 url="https://v.qq.com/channel/movie?_all=1&channel=movie&listpage=1&sort=18"
12 headers={
13 'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '+
14 'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36'
15 }
16 # res = urllib.request.urlopen(url)
17 res = urllib.request.Request(url=url,headers=headers) #编辑request请求
18 response=urllib.request.urlopen(res).read().decode() #读取
19 html=BeautifulSoup(response,"html.parser") #解析
20 #
21 # list=html.select(".figure_score")
22 # for item in list:
23 # print(item)
24 dataRes=[]
25 findLink=re.compile(r'href="(.*?)"') #链接
26 findName=re.compile(r'title="(.*?)"') #影片名
27 soup=html.find_all(r"a",class_="figure")
28 for i in soup:
29 # print(i)
30 words=str(i)
31 dataRes.append(re.findall(findLink,words)) #添加链接
32 dataRes.append(re.findall(findName,words)) #添加影片名
33 for i in dataRes:
34 print(i)
35 # print(html)
36 # print(html.head.contents) #输出tag的所有子节点(list)
37 # print(response)
38 return res
39 if __name__ == '__main__':
40 get_ten()
好看请赞,养成习惯:) 本文来自博客园,作者:靠谱杨, 转载请注明原文链接:https://www.cnblogs.com/rainbow-1/p/14708814.html
欢迎来我的51CTO博客主页踩一踩 我的51CTO博客
文章中的公众号名称可能有误,请统一搜索:靠谱杨的秘密基地
分类:
树懒电影项目(个人总结记录)
标签:
软件工程
, Python数据处理
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具