摘要:
根据特定的需求,抓取指定的数据 代替浏览器上网 网页的特点: 1、网页都有自己唯一的URL 2、网页内容都是html结构 3、使用的都是http或https协议 爬虫步骤: 1、给一个URL 2、写程序,模拟浏览器访问URL 3、解析内容,提取数据 环境: windows环境、linux环境 pyt 阅读全文
摘要:
gzip可以解开compress、zip、gzip等软件所压缩的文件、 gzip [option] 文件名 -c:将压缩的数据输出到屏幕,可通过数据重定向来处理 -d:解压缩 -t:可以用来检验一个压缩文件的一致性 -v:可以显示出原文件/压缩文件的压缩比等信息 -#:#为数字,代表压缩等级,-1位 阅读全文