摘要: 1.信息标记的三种形式 (1)XML(eXtensible Markup Language)可扩展标记语音 <name> … </name>有内容的标签<name />无内容的标签<!‐‐ ‐‐>注释 (2)JSON(JavsScript Object Notation)有类型的键值对 key:va 阅读全文
posted @ 2018-02-27 17:29 WY~记录 阅读(318) 评论(0) 推荐(0) 编辑
摘要: 1.Beautiful Soup库的安装 Win平台: “以管理员身份运行”cmd执行 pip install beautifulsoup4 from bs4 import BeautifulSoup导入以缩写bs4为库名 2.soup = BeautifulSoup('需要解析的html代码', 阅读全文
posted @ 2018-02-27 11:27 WY~记录 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 1.解除User‐Agent限制 改变headers,冒充浏览器 kv={"User‐Agent":"Mozilla/5.0"} r=requests.get(url,headers=kv) 2.搜索关键词提交 百度的关键词接口:http://www.baidu.com/s?wd=keyword36 阅读全文
posted @ 2018-02-27 10:01 WY~记录 阅读(191) 评论(0) 推荐(0) 编辑