随笔分类 - Python爬虫
1_requests基础用法
摘要:requests模块的基本使用 什么是requests模块? Python中封装好的一个基于网络请求的模块 requests模块的作用? 用来模拟浏览器发请求 requests模块的环境安装: pip install requests requests模块的编写流程: 指定url 发起请求:(1)
2_爬豆瓣电影_ajax动态加载
摘要:爬豆瓣 什么是 AJAX ? AJAX 是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。 AJAX = Asynchronous JavaScript and XML(AJAX = 异步 JavaScript 和 XML。)。 AJAX 不是新的编程语言,而是一种使用现有标准的新方法。
3_肯德基餐厅信息查询_动态加载_post请求
摘要:肯德基餐厅信息查询网址:http://www.kfc.com.cn/kfccda/storelist/index.aspx import requests url = 'http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=cname' hea
4_爬NMPA药监总局_动态加载_传ID
摘要:http://scxk.nmpa.gov.cn:81/xk/ import requests url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList' headers = { 'User-Agen