2017 年 8月 14 日随笔档案 - 怪咖在骚动

2017年8月14日

摘要：网页下载器：将互联网上URL对应的网页下载到本地的工具通过网页下载器将互联网中的url网页，存储到本地或内存字符串 python有哪几种网页下载器？ 1.urllib2 python官方基础模块 2.requests python第三方包更强大 urllib2下载网页方法1：最简洁方法 url > 阅读全文

posted @ 2017-08-14 18:35 怪咖在骚动阅读(158) 评论(0) 推荐(0) 编辑

第4章 URL管理器和实现方法

摘要： URL管理器：管理待抓取URL集合和已抓取URL集合 -- 防止重复抓取、防止循环抓取 URL需要支持哪些功能：添加新URL到待爬取集合中、判断待添加URL是否在容器中，判断是否还有待爬取URL，获取待爬取URL，将URL从待爬取移动到已爬取。 URL管理器的实现方式： 1.内存 python内存阅读全文

posted @ 2017-08-14 16:13 怪咖在骚动阅读(272) 评论(0) 推荐(0) 编辑

第3章简单爬虫架构

摘要：第一节 python简单爬虫架构 1.爬虫调度端 2. 爬虫：URL管理器、网页下载器、网页解析器 3.价值数据第二节 python简单爬虫架构的动态阅读全文

posted @ 2017-08-14 16:07 怪咖在骚动阅读(94) 评论(0) 推荐(0) 编辑

第2章爬虫简介以及爬虫的技术价值...

摘要： 1.爬虫简介爬虫：一段自动抓取互联网信息的程序多个URL构成互联网，人工获取url，爬虫获取url，在网页上获取有价值的数据2.爬虫技术价值价值：互联网数据，为我所用！爬取数据，分析数据互联网上的数据能够更友好的被用户看到和使用。阅读全文

posted @ 2017-08-14 16:00 怪咖在骚动阅读(318) 评论(0) 推荐(0) 编辑

慕课网学习--第一章课程介绍

摘要：课程内容地址：http://www.imooc.com/video/10674 1.爬虫简介 2.简单爬虫架构 3.URL管理器 4.网页下载器(rullib2) 5.网页解析器(BeautifulSoup) 6.完整实例爬去百度百科Python词条相关的1000个页面数据阅读全文

posted @ 2017-08-14 15:54 怪咖在骚动阅读(153) 评论(0) 推荐(0) 编辑

微信小程序的文件结构 —— 微信小程序教程系列（1）

摘要：所有文章均是CSDN博客所看，已按照作者要求，注明出处了，感谢作者的整理！博客文章地址：http://blog.csdn.net/michael_ouyang/article/details/54883903 阅读全文

posted @ 2017-08-14 15:44 怪咖在骚动阅读(134) 评论(0) 推荐(0) 编辑

微信开发者工具的快捷键

摘要：博客地址：http://blog.csdn.net/michael_ouyang/article/details/54883402 阅读全文

posted @ 2017-08-14 15:40 怪咖在骚动阅读(184) 评论(0) 推荐(0) 编辑

微信小程序之如何注册微信小程序

摘要：所有文章均是CSDN博客所看，已按照作者要求，注明出处了，感谢作者的整理！博客文章地址：http://blog.csdn.net/michael_ouyang/article/details/54698062 阅读全文

posted @ 2017-08-14 15:33 怪咖在骚动阅读(216) 评论(0) 推荐(0) 编辑

怪咖在骚动

一个喜欢听音乐看电影的程序员

公告