摘要: 根据特定的需求,抓取指定的数据 代替浏览器上网 网页的特点: 1、网页都有自己唯一的URL 2、网页内容都是html结构 3、使用的都是http或https协议 爬虫步骤: 1、给一个URL 2、写程序,模拟浏览器访问URL 3、解析内容,提取数据 环境: windows环境、linux环境 pyt 阅读全文
posted @ 2018-12-25 23:19 jackpod 阅读(141) 评论(0) 推荐(0) 编辑
摘要: gzip可以解开compress、zip、gzip等软件所压缩的文件、 gzip [option] 文件名 -c:将压缩的数据输出到屏幕,可通过数据重定向来处理 -d:解压缩 -t:可以用来检验一个压缩文件的一致性 -v:可以显示出原文件/压缩文件的压缩比等信息 -#:#为数字,代表压缩等级,-1位 阅读全文
posted @ 2018-07-16 15:34 jackpod 阅读(276) 评论(0) 推荐(0) 编辑