随笔分类 - 爬虫
摘要:《MongoDB权威指南》 一、简介 MongoDB是一款强大、灵活、且易于扩展的通用型数据库 1、易用性 2、易扩展性 3、丰富的功能 4、卓越的性能 二、MongoDB基础知识 1、文档是MongoDB的核心概念。文档就是键值对的一个有序集{'msg':'hello','foo':3}。类似于p
阅读全文
摘要:一、介绍 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.你可能在寻找 Beautiful Soup3 的文档,Beautifu
阅读全文
摘要:官网:http://selenium-python.readthedocs.io 一、背景及用途 二、安装 #安装:selenium+chromedriver pip3 install selenium 下载chromdriver.exe放到python安装路径的scripts目录中即可,注意最新版
阅读全文
摘要:一、概念 + 基本 1、requests模块是什么: 使用requests可以模拟浏览器的请求,比起之前用到的urllib,requests模块的api更加便捷(本质就是封装了urllib3) 注意:requests库发送请求将网页内容下载下来以后,并不会执行js代码,这需要我们自己分析目标站点然后
阅读全文