摘要: 最近在看scrapy一个知乎的初级教程 安装 使用国内源 1.scrapy startproject zimulku 创建一个项目 2.cd zimuku 进入项目目录 3.scrapy genspider demo http://zimuku.net 创建第一个爬虫 4.从 /spiders/de 阅读全文
posted @ 2017-12-18 16:29 点||点 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 最近在看scrapy一个知乎的初级教程 安装 使用国内源 1.scrapy startproject zimulku 创建一个项目 2.cd zimuku 进入项目目录 3.scrapy genspider demo http://zimuku.net 创建第一个爬虫 4.从 /spiders/de 阅读全文
posted @ 2017-12-07 10:53 点||点 阅读(1433) 评论(0) 推荐(0) 编辑
摘要: python在内存中对所有数据都是ascii码存储的 所有要解析出来 你首页要 把当前计算的的编码告诉Python 如 阅读全文
posted @ 2017-12-03 21:49 点||点 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 下载node.js windows一路next到底 cmd 下 node version 看版本 npm v 第二步 替换源 吧npm安装改成 cnpm 第三步 安装 vue 第四步 新建一个目录 比如D盘 xxx文件夹 然后cmd切换到改目录 在遇到 Use ESLint to lint your 阅读全文
posted @ 2017-11-14 14:27 点||点 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 1.SFrame print(sf) 阅读全文
posted @ 2017-11-12 11:24 点||点 阅读(605) 评论(0) 推荐(0) 编辑
摘要: 1.下载Anaconda 并安装 2. 创建conda环境 创建完成以后 在开始 看到gl env的就属于创建的conda环境 3.更新pip版本 保证pip 7 4.安装graphlab 这里的邮箱和key都是你在申请的时候出现的 5.安装ipython notebool 在virtualenv中 阅读全文
posted @ 2017-11-12 11:01 点||点 阅读(936) 评论(0) 推荐(0) 编辑
摘要: 创建项目 目录结构 item是存储需要爬取的字段设定 Spider: 数据请求处理部分 PIPELINE: 数据保存部分 选择保存到数据库还是文本文件 把PIPELINE编写的放到setting里面 运行项目 scrapy crawl Sutianqi 阅读全文
posted @ 2017-11-08 11:41 点||点 阅读(1252) 评论(0) 推荐(0) 编辑
摘要: 感觉拿栈的思想去验证左右括号太二了,改变下顺序 从栈顶出去就不靠谱了 栈做迷宫还是比较靠谱的 阅读全文
posted @ 2017-10-27 14:40 点||点 阅读(121) 评论(0) 推荐(0) 编辑
摘要: ``` 1 数字:^[0-9]*$ 2 n位的数字:^\d{n}$ 3 至少n位的数字:^\d{n,}$ 4 m-n位的数字:^\d{m,n}$ 5 零和非零开头的数字:^(0|[1-9][0-9]*)$ 6 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$ 7 带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})... 阅读全文
posted @ 2017-10-27 11:46 点||点 阅读(116) 评论(0) 推荐(0) 编辑
摘要: 1.堆序排序的核心是要先建立堆 然后进行调整 堆的特点 任意子节点都比父节点小 2.调整 把最后一个元素和堆顶进行对比 如果大就保留 代码 阅读全文
posted @ 2017-10-26 13:54 点||点 阅读(140) 评论(0) 推荐(0) 编辑