Python爬取腾讯视频电影名称和链接(一)

复制代码
 1 import requests
 2 import json
 3 from bs4 import BeautifulSoup       #网页解析获取数据
 4 import sys
 5 import re
 6 import urllib.request,urllib.error #制定url,获取网页数据
 7 import sqlite3
 8 import xlwt     #excel操作
 9 
10 def get_ten():
11     url="https://v.qq.com/channel/movie?_all=1&channel=movie&listpage=1&sort=18"
12     headers={
13         'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '+
14                        'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36'
15     }
16     # res = urllib.request.urlopen(url)
17     res = urllib.request.Request(url=url,headers=headers)       #编辑request请求
18     response=urllib.request.urlopen(res).read().decode()        #读取
19     html=BeautifulSoup(response,"html.parser")      #解析
20     #
21     # list=html.select(".figure_score")
22     # for item in list:
23     #     print(item)
24     dataRes=[]
25     findLink=re.compile(r'href="(.*?)"')        #链接
26     findName=re.compile(r'title="(.*?)"')       #影片名
27     soup=html.find_all(r"a",class_="figure")
28     for i in soup:
29         # print(i)
30         words=str(i)
31         dataRes.append(re.findall(findLink,words))       #添加链接
32         dataRes.append(re.findall(findName,words))       #添加影片名
33     for i in dataRes:
34         print(i)
35     # print(html)
36     # print(html.head.contents)       #输出tag的所有子节点(list)
37     # print(response)
38     return res
39 if __name__ == '__main__':
40     get_ten()
复制代码

 

posted @   靠谱杨  阅读(1629)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具

喜欢请打赏

扫描二维码打赏

了解更多

点击右上角即可分享
微信分享提示