摘要: 描述:requests是python的一个第三方HTTP(Hypertext Transfer Protocol,超文本传输协议)库,它比python自带的网络库urllib更加简单、方便和人性化;使用requests可以让python实现访问网页并获取源代码的功能;使用requests获取网页的源 阅读全文
posted @ 2020-02-09 15:03 Norni 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 描述:Python的文件操作涉及对文件的读/写与编码的处理。 1、两种写法 1.1 第一种 1 f = open('文件路径', '文件操作方式', encoding='utf-8') 2 对文件操作 3 f.close() 1.2 第二种 1 with open('文件路径', '文件操作方式', 阅读全文
posted @ 2020-02-09 14:54 Norni 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 描述:正则表达式能够从一段文本中提取有用的信息。 0、使用正则表达式有如下步骤: (1)寻找规律; (2)使用正则符号表示规律 (3)提取信息 1、正则表达式的基本符号 1.1 点号“.” 一个点号可以代替除了换行符以外的任何一个字符,包括但不限于英文字母、数字、汉字、英文标点符号和中文标点符号。 阅读全文
posted @ 2020-02-09 13:49 Norni 阅读(281) 评论(0) 推荐(0) 编辑
摘要: 1、Python的安装和运行 2、Python开发环境 3、Python的数据结构和控制结构 数据结构 3.1 整数、浮点数和变量 3.1.1 整数和浮点数 整数 浮点数:带有小数点 3.2 变量 3.3 字符串、列表、元组、集合、字典 3.3.1 字符串(string) 任何被单引号或则双引号括 阅读全文
posted @ 2020-02-09 11:44 Norni 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 描述:介绍爬虫相关概念 1、爬虫:本质上是一种计算机程序,取数据时的行为和蜘蛛在网上逐条逐行爬行一样,即Spider。 2、爬虫的作用:(1)收集数据。(2)调查目标 (3)刷流量和秒杀 阅读全文
posted @ 2020-02-09 11:32 Norni 阅读(256) 评论(0) 推荐(0) 编辑