python学习3

所花时间(包括上课):

 2h

代码量(行):

 150左右

搏客量(篇):

 1

了解到的知识点:

python

备注(其他):

 

破解百度翻译

复制代码
复制代码
import requests
import json
if __name__ == '__main__':
    #UA伪装:让爬虫对应的请求载体身份标识伪装成某一款浏览器
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 SLBrowser/9.0.0.10191 SLBChan/103'
    }
    post_url='https://fanyi.baidu.com/sug'
    kw=input('输入字段')
    data = {
        'kw':kw
    }
    response=requests.post(url=post_url,data=data,headers=headers)
    dic_obj =response.json()
    fileName =kw+'.json'
    fp=open(fileName,'w',encoding='utf-8')
    json.dump(dic_obj,fp=fp,ensure_ascii=False)
    print('爬取数据完成')
复制代码
复制代码

爬取结果

 

3、豆瓣电影排行

复制代码
复制代码
import requests
import json
if __name__ == '__main__':
  #网页检查
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 SLBrowser/9.0.0.10191 SLBChan/103'
    }
    url=' https://movie.douban.com/j/chart/top_list'
#运行界面时,进入检查界面中的XHR,找到json数据
param = { 'type':'24', 'interval_id':'100:90', 'action':'', 'start':'0',#从库的第几部电影去取 'limit':'20',#一次取出的个数 } response = requests.get(url=url, params=param, headers=headers) list_data =response.json() fp=open('./douban.json','w',encoding='utf-8') json.dump(list_data,fp=fp,ensure_ascii=False) print('爬取数据完成')
复制代码
复制代码

爬取结果

 

json在线转化

 

posted @   平安喜乐×  阅读(7)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
· SQL Server 2025 AI相关能力初探
· 为什么 退出登录 或 修改密码 无法使 token 失效
点击右上角即可分享
微信分享提示