Master跑跑

2019年3月6日

摘要：一.函数(def) 函数，对于函数这个概念，大家都想必很熟悉，函数广泛应用于数学，科技，医疗等等众多行业。那么，在Python中，函数就是带名字的代码块。函数最显现的作用就是将一个代码块封装起来，你要调用它的时候就输入函数名，无需输入重复的代码。现在来一个快速的例子展现一下函数： def gr 阅读全文

posted @ 2019-03-06 11:49 Master跑跑阅读(142) 评论(0) 推荐(0)

2019年1月28日

扎实基础深入篇（六）：while循环带动生产力

摘要：在本篇博客中，你将学习如何让程序不断地运行，让用户能够根据需要输入信息，并在程序中使用这些信息。为此，你需要使用wile循环让程序不断地运行，直到指定的条件不满足为止。注意：在学习循环的路上，一定要学会刹车！在进入本篇博客学习之前，我们需要解决一下上篇博客留下来的作业：创建一个名为citie 阅读全文

posted @ 2019-01-28 22:15 Master跑跑阅读(366) 评论(0) 推荐(0)

2019年1月26日

扎实基础深入篇（五）：字典也就是个弟弟

摘要：在本篇博客中，你将能学习到能够将相关信息关联起来的Python字典，以及一些对字典的操作。在讲正事之前，不能忘了上一篇博客布置下来的作业：答案如下：输出结果： mack 你好，你注册的名字可用。tom 你好，你注册的名字可用。Mary 你好,你注册的名字已被占用,请重新注册。alice 你好, 阅读全文

posted @ 2019-01-26 19:00 Master跑跑阅读(364) 评论(0) 推荐(0)

2019年1月24日

扎实基础深入篇（四）：听说if语句很叼？

摘要：编程时经常需要检查一系列条件，并根据此决定采取什么措施。在python中，if语句让你能够检查程序的当前状态，并根据此采取相应的措施。一个快速简单的示例 # 目标结果：打印出歌手GAI，猫和老鼠的Tom和外国美女rose。 persons=["jack","tom","jerry","gai", 阅读全文

posted @ 2019-01-24 01:19 Master跑跑阅读(312) 评论(0) 推荐(0)

2019年1月18日

lxml类库的xpath的使用

摘要：为什么要学习lxml类库和xpath呢？ -lxml类库是一款高性能的Python HTML/XML解析器，我们可以利用XPath，来快速地定位特定元素以及获取节点信息。 -XPath是一门在HTML/XML文档中查找信息的语言，可用来在HTML/XML文档中对元素和属性进行遍历。 XML和HTM 阅读全文

posted @ 2019-01-18 16:02 Master跑跑阅读(729) 评论(0) 推荐(0)

2019年1月16日

json与re的再次复习

摘要：在浏览本文之前，建议先温习一下以下博客的链接： https://www.cnblogs.com/Masterpaopao/p/10061575.html 一.json json，在爬虫中毫无疑问扮演着极为重要的角色： JSON是一种轻量级的数据交换格式，适用于进行数据交互的场景。在python中，阅读全文

posted @ 2019-01-16 23:41 Master跑跑阅读(500) 评论(0) 推荐(0)

2019年1月12日

更多Requests的小技巧以及总结

摘要：对于requests的爬虫库，我们已经学到了尾声。我们在这儿可以挖掘出更多的requests的使用小技巧。一.cookie对象与字典的转换在爬取目标cookie的时候，我们可以将cookie信息进行简化处理。现在做一个简单的代码验证看看，使用百度的cookies： import reques 阅读全文

posted @ 2019-01-12 23:54 Master跑跑阅读(873) 评论(0) 推荐(0)

更全面的寻找post地址

摘要：我们在今后的爬虫学习过程中，要爬许许多多的网站。唯有掌握如何对不同网站寻找到正确的post地址，才是任务之重。比如，我访问了一个别的网站，这儿用人人网做例子。在人人网登陆界面，使用F12进入开发者模式，找到整个登陆界面的源码：所以，我们可以看到关键的登录模块源码有一个关键的参数，这个参数是a 阅读全文

posted @ 2019-01-12 17:50 Master跑跑阅读(1316) 评论(0) 推荐(0)

2019年1月10日

学会使用ip池和cookie池伪装

摘要：在进入正题之前，我们先复习一个关于requests模块的相关知识点： requests中解决编码的三种方法： ①response.content 类型：bytes 解码类型：没有指定如何修改编码方式：response.content.decode() ②response.content.decod 阅读全文

posted @ 2019-01-10 19:20 Master跑跑阅读(2697) 评论(1) 推荐(0)

2019年1月9日

贴吧小爬虫之爬取源码

摘要：在做爬虫工作之前，永远先做好笔记：确定要爬取的url，爬取的具体内容是什么，用什么形式展现爬取到的内容。博客的标题大家也看到了，爬取的是贴吧的源码，也就是说任何贴吧的源码都能爬。不光第一页还要爬，第二页第三页……都要爬。确定了上面的内容，那就可以开始代码的编写了。我最近在玩穿越火线，那就爬阅读全文

posted @ 2019-01-09 19:05 Master跑跑阅读(742) 评论(0) 推荐(0)

公告