摘要:
一.函数(def) 函数,对于函数这个概念,大家都想必很熟悉,函数广泛应用于数学,科技,医疗等等众多行业。 那么,在Python中,函数就是带名字的代码块。 函数最显现的作用就是将一个代码块封装起来,你要调用它的时候就输入函数名,无需输入重复的代码。 现在来一个快速的例子展现一下函数: def gr 阅读全文
摘要:
在本篇博客中,你将学习如何让程序不断地运行,让用户能够根据需要输入信息,并在程序中使用这些信息。 为此,你需要使用wile循环让程序不断地运行,直到指定的条件不满足为止。 注意:在学习循环的路上,一定要学会刹车! 在进入本篇博客学习之前,我们需要解决一下上篇博客留下来的作业: 创建一个名为citie 阅读全文
摘要:
在本篇博客中,你将能学习到能够将相关信息关联起来的Python字典,以及一些对字典的操作。 在讲正事之前,不能忘了上一篇博客布置下来的作业: 答案如下: 输出结果: mack 你好,你注册的名字可用。tom 你好,你注册的名字可用。Mary 你好,你注册的名字已被占用,请重新注册。alice 你好, 阅读全文
摘要:
编程时经常需要检查一系列条件,并根据此决定采取什么措施。 在python中,if语句让你能够检查程序的当前状态,并根据此采取相应的措施。 一个快速简单的示例 # 目标结果:打印出歌手GAI,猫和老鼠的Tom和外国美女rose。 persons=["jack","tom","jerry","gai", 阅读全文
摘要:
为什么要学习lxml类库和xpath呢? -lxml类库是一款高性能的Python HTML/XML解析器,我们可以利用XPath, 来快速地定位特定元素以及获取节点信息。 -XPath是一门在HTML/XML文档中查找信息的语言,可用来在HTML/XML文档中对元素和属性进行遍历。 XML和HTM 阅读全文
摘要:
在浏览本文之前,建议先温习一下以下博客的链接: https://www.cnblogs.com/Masterpaopao/p/10061575.html 一.json json,在爬虫中毫无疑问扮演着极为重要的角色: JSON是一种轻量级的数据交换格式,适用于进行数据交互的场景。 在python中, 阅读全文
摘要:
对于requests的爬虫库,我们已经学到了尾声。 我们在这儿可以挖掘出更多的requests的使用小技巧。 一.cookie对象与字典的转换 在爬取目标cookie的时候,我们可以将cookie信息进行简化处理。 现在做一个简单的代码验证看看,使用百度的cookies: import reques 阅读全文
摘要:
我们在今后的爬虫学习过程中,要爬许许多多的网站。 唯有掌握如何对不同网站寻找到正确的post地址,才是任务之重。 比如,我访问了一个别的网站,这儿用人人网做例子。 在人人网登陆界面,使用F12进入开发者模式,找到整个登陆界面的源码: 所以,我们可以看到关键的登录模块源码有一个关键的参数,这个参数是a 阅读全文
摘要:
在进入正题之前,我们先复习一个关于requests模块的相关知识点: requests中解决编码的三种方法: ①response.content 类型:bytes 解码类型:没有指定 如何修改编码方式:response.content.decode() ②response.content.decod 阅读全文
摘要:
在做爬虫工作之前,永远先做好笔记: 确定要爬取的url,爬取的具体内容是什么,用什么形式展现爬取到的内容。 博客的标题大家也看到了,爬取的是贴吧的源码,也就是说任何贴吧的源码都能爬。 不光第一页还要爬,第二页第三页……都要爬。 确定了上面的内容,那就可以开始代码的编写了。 我最近在玩穿越火线,那就爬 阅读全文