摘要: https://blog.csdn.net/qq_36609501/article/details/87928687 阅读全文
posted @ 2019-03-02 15:12 小小小白1226 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 1. 可配置爬虫 。爬虫的启动停止(os.system) 。爬虫基本爬取数据的设置(起始网页,解析规则,停止条件) 。爬虫的进度指示 。爬虫的数据存储 2. 增量爬虫 。怎么知道爬取的改变 3. 分布式爬虫 4. 反爬虫 阅读全文
posted @ 2019-03-02 14:32 小小小白1226 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 1. 关系型数据库(Mysql,Qracle,postgresql,sqlite3) 2. 非关系型数据库(NoSQL)(redis,mongodb,cassandra)(Hbase)(图数据库neo4j) @1 关系型数据库通过外键关联来建立表与表之间的关系 @2 非关系型数据库通常指数据以对象的 阅读全文
posted @ 2019-03-02 14:21 小小小白1226 阅读(274) 评论(0) 推荐(0) 编辑