11 2018 档案
摘要:1. 打开页面获取源代码 1.1 urllib模块 import urllib.request html =urllib.request.urlopen('https://movie.douban.com/subject/3168101/?from=showing').read() html = h
阅读全文
摘要:网络爬虫:可以理解成网页蜘蛛,在网页上采集数据 爬取流程: 1、导入模块 2、打开网页,获取原码 3、获取章节原码 4、获取正文 5、过滤‘杂质’ 6、保存下载 废话不多说开始爬!!! 今天爬的网站是 全书网—斗罗大陆 准备工作、首先我们先导入两个模块 import urllib.request #
阅读全文
摘要:Excel操作 Excel是当今最流行的电子表格处理软件,支持丰富的计算函数及图表,在系统运营方面广泛用于运营数据报表,比如业务质量、资源利用、安全扫描等报表,同时也是应用系统常见的文件导出格式,以便数据使用人员做进一步加工处理。 本节主要讲述利用Python操作Excel的模块XIsxWriter
阅读全文
摘要:1. """文件内容如下,标题为:姓名,性别,年纪,薪资 egon male 18 3000 要求: 从文件中取出每一条记录放入列表中, 列表的每个元素都是{'name':'egon','sex':'male','age':18,'salary':3000}的形式 """ a = open('a',
阅读全文
摘要:#1. 打开文件的模式有(默认为文本模式): r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】 w,只写模式【不可读;不存在则创建;存在则清空内容】 a, 之追加写模式【不可读;不存在则创建;存在则只追加内容】 #2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有
阅读全文