python爬虫-爬取百度图片
Published on 2020-08-28 14:17 in 分类: python with 萧海~
分类: python

python爬虫-爬取百度图片

    python爬虫-爬取百度图片(转)
    #!/usr/bin/python
    # coding=utf-8
    # 作者 :Y0010026
    # 创建时间 :2018/12/16 16:16
    # 文件 :spider_04.py
    # IDE :PyCharm

    # 爬取百度图片(GET方式爬取Ajax数据)
    import urllib2

    url = 'http://image.baidu.com/search//acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=' \
    'result&queryWord=%E9%9D%92%E6%98%A5%E5%A6%B9%E5%AD%90%E5%9B%BE&cl=2&lm=-1&ie=utf-8&oe=' \
    'utf-8&adpicid=&st=&z=&ic=&word=%E9%9D%92%E6%98%A5%E5%A6%B9%E5%AD%90%E5%9B%BE&s=&se=&tab=&width=' \
    '&height=&face=&istype=&qc=&nc=&fr=&pn=30&rn=30&gsm=1e&1502192101260='

    # 请求头描述信息
    header = {
    'User-Agent': 'Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1'
    }
    # 包装请求对象
    requset = urllib2.Request(url, headers=header)
    # 根据请求对象发送数据请求,获取服务器返回的响应对象
    response = urllib2.urlopen(requset)
    # 获取响应对象中的数据
    content = response.read()
    # 将获取的数据保存在文件中
    with open('qing.json', 'w') as f:
    f.write(content)
    原文链接:https://www.cnblogs.com/huangjiaxiaoluobo/p/10126963.html
    posted @   萧海~  阅读(367)  评论(0编辑  收藏  举报
    编辑推荐:
    · 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
    · AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
    · 基于Microsoft.Extensions.AI核心库实现RAG应用
    · Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
    · 开发者必知的日志记录最佳实践
    阅读排行:
    · winform 绘制太阳,地球,月球 运作规律
    · AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
    · 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
    · 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
    · 上周热点回顾(3.3-3.9)
    点击右上角即可分享
    微信分享提示
    电磁波切换