2019年8月15日
摘要: 一 什么是HTML HTML,全称是超文本标记语言(HyperText Markup Language),它是一种用于创建网页的标记语言。标记语言是一种将文本(Text)以及文本相关的其他信息结合起来,展现出关于文档结构和数据处理细节的计算机文字编码。与文本相关的其他信息(包括例如文本的结构和表示信 阅读全文
posted @ 2019-08-15 11:41 cs_1993 阅读(285) 评论(0) 推荐(0) 编辑
摘要: 硬盘存储 (1) 基于终端指令 * 保证parse方法返回一个可迭代类型的对象(存储解析到页面内容) * 使用终端指定完成数据存储到磁盘文件的操作 scrapy crawl 爬虫文件名称 -o 磁盘文件.后缀 (2) 基于管道 * items: 存储解析到的页面数据 * piplines: 处理持久 阅读全文
posted @ 2019-08-15 10:22 cs_1993 阅读(195) 评论(0) 推荐(0) 编辑