摘要: 分布式爬虫 Xpath 正则表达式 动态网页 Headless的浏览器:phantomJS 浏览器的驱动:Selenium 1.Xpath 基本语法: 表达式:nodename(节点名) 选取此节点的所有子节点,tag或*选择任意的tag / 从根节点选取,选择直接子节点,不包含更小的后代(例如孙、 阅读全文
posted @ 2019-03-08 16:49 jacky912 阅读(462) 评论(0) 推荐(0) 编辑
摘要: 1.环境搭建-Python Unix 基础环境-Windows 1.pip,并设置pip源 1.直接下载Anaconda,很多比较难以安装的资源都已经包含了 配置pip conf,自动设置源 配置pip源,各个系统默认pip.ini位置不同,需要根据实际情况设置 #mkdir ~/.pip/ 官网: 阅读全文
posted @ 2019-03-08 14:31 jacky912 阅读(1464) 评论(0) 推荐(0) 编辑