摘要: 正则匹配协议+域名+端口: 阅读全文
posted @ 2017-12-28 16:24 scissors 阅读(2144) 评论(0) 推荐(2) 编辑
摘要: 1.进入操作数据库界面 2,。查询某个表的所有字段 3.查询表名 4.查询带有条件的表名 5.查询具体结果 阅读全文
posted @ 2017-12-21 10:05 scissors 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 实战演练 1. 分析目标 目标:百度百科Python词条相关词条网页-标题和简介 入口页:https://baike.baidu.com/item/Python/407313 URL格式: - 词条页面URL:/item/Perl 数据格式: - 标题: <dd class="lemmaWgt-le 阅读全文
posted @ 2017-12-19 15:38 scissors 阅读(92) 评论(0) 推荐(0) 编辑
摘要: IndentationError: unindent does not match any outer indentation level TabError: inconsistent use of tabs and spaces in indentation 产生原因: tab与空格混用 解决方式 阅读全文
posted @ 2017-12-19 14:15 scissors 阅读(174) 评论(0) 推荐(0) 编辑
摘要: python简单爬虫实现day1 一、简单爬虫架构 爬虫调度端 URL管理器 网页下载器 网页解析器 价值数据 二、模块分析 1.URL管理器 URL管理器:管理待抓取URL集合和已抓取URL集合 - 防止重复抓取、防止循环抓取 功能: 实现方式: 内存 (python内存,待爬取URL集合:set 阅读全文
posted @ 2017-12-18 14:28 scissors 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 一、windows安装virtualenvwrapper 1. 运行 pip install virtualenv virtualenvwrapper 命令 (如果安装慢可以使用豆瓣源 pip install -i http://pypi.douban.com/simple scrapy) 2. 运 阅读全文
posted @ 2017-12-18 14:21 scissors 阅读(1410) 评论(0) 推荐(1) 编辑