Python爬取中国票房网所有电影片名和演员名字，爬取齐鲁网大陆所有电视剧名称

爬取CBO中国票房网所有电影片名和演员名字

# -*- coding: utf-8 -*-
# 爬取CBO中国票房网所有电影片名
import json
import requests
import time

with open("moviename.txt", 'a') as fh:
    for pn in range(1,320):
        url = 'http://www.cbooo.cn/Mdata/getMdata_movie?area=50&type=0&year=0&initial=%E5%85%A8%E9%83%A8&pIndex=' + str(pn)
        print(url)
        time.sleep(2)
        try:
            result = requests.get(url).text
            jresult = json.loads(result)
            movices = jresult.get('pData')
            for movie in movices:
                moviename = movie.get('MovieName')
                print(moviename)
                fh.write(moviename + "\n")
        except:
            print('第'+ str(pn) + '失败！')

# 爬取CBO中国票房网所有演员
import json
import requests
import time

with open("moviestar.txt", 'a') as fh:
    for pn in range(1,2665):
        url = 'http://www.cbooo.cn/Mdata/getMdate_pList?area=50&type=0&year=0&initial=%E5%85%A8%E9%83%A8&pIndex=' + str(pn)
        print(url)
        time.sleep(2)
        try:
            result = requests.get(url).text
            jresult = json.loads(result)
            movices = jresult.get('pData')
            for movie in movices:
                moviename = movie.get('cnName')
                print(moviename)
                fh.write(moviename + "\n")
        except:
            print('第'+ str(pn) + '失败！')

爬取电视剧名称

# -*- coding: utf-8 -*-
# 爬取所有电视剧名称
# 来源：齐鲁电影网

from bs4 import BeautifulSoup
import urllib
url = "http://www.qilumovie.com/filmclass-txt/9.html"
html = urllib.request.urlopen(url).read()
htmldecode = html.decode("gbk") #重点关注
soup = BeautifulSoup(htmldecode,"lxml")
body = soup.body
maplist = body.find_all("li")

with open("tvplay.txt",'a') as fh:
    for tvl in maplist:
        tv = tvl.a.text
        print(tv)
        fh.write(tv + '\n')

如有错误，还请大侠指教一二！

posted @ 2017-08-21 16:39 宝山方圆阅读(1710) 评论(6) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· winform 绘制太阳，地球，月球运作规律
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具

公告

赞赏

备注微信号，用以进行更多问题的讨论和解决。

您的每次打赏，都将鼓励作者进行更多问题的分享与总结。

昵称：宝山方圆
园龄： 10年11个月
粉丝： 21
关注： 4

+加关注

2025年3月

日

一

二

三

四

五

六

zhzhang

精进自己，分享他人！

Python爬取中国票房网所有电影片名和演员名字，爬取齐鲁网大陆所有电视剧名称

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

相册

阅读排行榜

评论排行榜

推荐排行榜

最新评论