摘要: 1. 将大文件拆分为小文件 I 通过二进制的方式将大文件读取出来,将其拆分存,以不同的文件方式存放在一个目录下面 II 提供两种操作方式交互式和命令行模式 2 将拆分之后的文件重新合并 I 将拆分后的文件以二进制的方式读取,再以二进制的方式保存 II 提供两种操作方式交互式和命令行模式 阅读全文
posted @ 2017-01-03 22:13 someOneHan 阅读(426) 评论(0) 推荐(0) 编辑
摘要: 在伴随学习爬虫的过程中学习了解的一些基础库和方法总结扩展 1. urllib 在urllib.request module中定义下面的一些方法 urllib.request.urlopen(url,data=None,[timeout,]*,cafile=None,capath=None,cadef 阅读全文
posted @ 2017-01-03 18:59 someOneHan 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 下载媒体文件 I 使用urllib.request.urlretrieve方法可以下载文件存为指定文件 from urllib.request import urlretrieve from urllib.request import urlopen from bs4 import Beautifu 阅读全文
posted @ 2017-01-03 14:16 someOneHan 阅读(241) 评论(0) 推荐(0) 编辑