眼镜儿

2019年10月17日

摘要：来自官网的诠释: 爬取的主要目标就是从非结构性的数据源中提取结构性数据, 如网页. Scrapy提供Item类来满足这样的需求. Item对象是一种简单的容器, 保存了爬取到的数据, 其提供了类似于词典的API, 以及用于声明可用字段的简单语法 Item是一种数据容器, 是作为蜘蛛与管道之间的数据载阅读全文

posted @ 2019-10-17 16:51 眼镜儿阅读(177) 评论(0) 推荐(0) 编辑

02 scrapy 入门

摘要： 1. 创建项目创建项目 scrapy startproject tutorial 创建spider cd tutorial scrapy genspider quotes quotes.toscrape.com 创建item class QuoteItem(scrapy.Item): text = 阅读全文

posted @ 2019-10-17 16:49 眼镜儿阅读(71) 评论(0) 推荐(0) 编辑

01 scrapy 框架介绍

摘要： 1. 架构介绍 engine: 引擎, 处理整个系统的数据流处理, 触发事务, 是整个框架的核心 Item: 项目, 它定义了爬取结果的数据结构, 爬取的数据会被赋值成Item对象 Scheduler: 调度器, 接受引擎发过来的请求并将其加入队列中, 在引擎再次请求的时候将请求提供给引擎 Down 阅读全文

posted @ 2019-10-17 16:38 眼镜儿阅读(130) 评论(0) 推荐(0) 编辑

selenium

摘要： seleinum中的方法汇总: 提供键盘支持填写表格拖放在不同窗口和框架之间移动弹出对话框: 访问浏览器历史记录操作cookie 等待页面加载完成常用actionchains click(on_element=None) : on_element : the element to be 阅读全文

posted @ 2019-10-17 09:38 眼镜儿阅读(174) 评论(0) 推荐(0) 编辑

2019年10月16日

js 数据类型和转化

摘要：运行JavaScript 使用 JavaScript: 前缀构造执行JavaScript的url 使用<script>元素来包含JavaScript代码导入js文件 <script src='test.js' type='' > </script> 定义变量的方式: 显式定义 : var a 隐式阅读全文

posted @ 2019-10-16 21:11 眼镜儿阅读(132) 评论(0) 推荐(0) 编辑

mysql索引

摘要：索引原理: 通过不断地缩小想要获取数据的范围来筛选出最终想要的结果，同时把随机的事件变成顺序的事件，也就是说，有了这种索引机制，我们可以总是用同一种查找方式来锁定数据。 b+ 树性质: 索引字段要尽量的小索引的最左匹配特性聚焦索引和辅助索引聚焦索引相同点: 不管是聚焦索引还是辅助索引,其内部都阅读全文

posted @ 2019-10-16 19:53 眼镜儿阅读(115) 评论(0) 推荐(0) 编辑

mysql数据导入导出

摘要： mysqldump工具 : 不适合大数据备份备份所有数据库 mysqldump -u root -p > all_databases.sql 备份指定数据库 mysqldump -u root -p --databases lalala > lalala_database.sql 备份指定的多个数阅读全文

posted @ 2019-10-16 18:42 眼镜儿阅读(98) 评论(0) 推荐(0) 编辑

mysql记录操作

摘要：使用insert实现数据插入: insert into class values(1,'1年1班'),(2,'1年2班'),(3,'2年1班'); insert into stu(name, cid) values('a',1),('b',2); insert into stu2 (id,name, 阅读全文

posted @ 2019-10-16 18:32 眼镜儿阅读(125) 评论(0) 推荐(0) 编辑

mysql表操作

摘要：引擎引擎种类 innodb : 支持事物, 支持行锁, 支持表锁, 支持外键, 适合表结构复杂, 写入更新操作较大的场景 myisam : 不支持事物, 只支持表锁, 优点是查询速度较快, 适合只读操作,或者写入操作很少的场景 memory : 数据存在内存中, 读写较快, 断电即消失指定引擎: 阅读全文

posted @ 2019-10-16 14:24 眼镜儿阅读(132) 评论(0) 推荐(0) 编辑

linux 修改镜像源

摘要： deepin 系统修改源 deb http://mirrors.ustc.edu.cn/deepin camel main contrib non-freedeb http://packages.deepin.com/deepin camel main contrib non-free ubantu 阅读全文

posted @ 2019-10-16 09:41 眼镜儿阅读(3409) 评论(0) 推荐(0) 编辑

公告