摘要: 根据特定的需求,抓取指定的数据 代替浏览器上网 网页的特点: 1、网页都有自己唯一的URL 2、网页内容都是html结构 3、使用的都是http或https协议 爬虫步骤: 1、给一个URL 2、写程序,模拟浏览器访问URL 3、解析内容,提取数据 环境: windows环境、linux环境 pyt 阅读全文
posted @ 2018-12-25 23:19 jackpod 阅读(139) 评论(0) 推荐(0) 编辑