上一页 1 ··· 34 35 36 37 38 39 40 41 42 ··· 49 下一页
摘要: 一.re 这个去匹配比较麻烦,以后也比较少用,简单看一个案例就行 二.使用re的注意点 1.Windows转义符 2.避免出错 在正则表达式中尽量使用原始字符串,在待匹配字符中看到什么就在正则表达式中写什么,不容易出问题 原始字符串的查看,可以借助ipython去查看,不要使用print 3. 阅读全文
posted @ 2019-02-26 21:09 阿布_alone 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 一.什么是爬虫 爬虫的概念: 通过编写程序,模拟浏览器上网,让其去互联网上爬取数据的过程. 爬虫的工作流程: 模拟浏览器发送请求->下载网页代码->只提取有用的数据->存放于数据库或文件中 爬虫的分类: 通用爬虫:爬取全部的页面数据. 聚焦爬虫: 抓取页面中局部的页面数据 增量式爬虫:爬取网站中更新 阅读全文
posted @ 2019-02-26 15:39 阿布_alone 阅读(3055) 评论(0) 推荐(1) 编辑
摘要: 一.xpath简介 XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。 XPath 使用路径表达式在 XML 文档中进行导航 XPath 包含一个标准函数库 XPath 是 XSLT 中的主要元素 XPath 是一个 W3C 标准 `节点 阅读全文
posted @ 2019-02-25 21:03 阿布_alone 阅读(836) 评论(0) 推荐(0) 编辑
摘要: 一.使用流程 二.基本语法 三.重点语法find和find_all 不带过滤器: print(soup.find_all()) #没有过滤,查找所有标签 字符串过滤器: print (soup.find_all()) #字符串过滤器,即标签名 列表: print(soup.find_(['a','b 阅读全文
posted @ 2019-02-24 22:32 阿布_alone 阅读(1907) 评论(0) 推荐(0) 编辑
摘要: 一.redis介绍: 1.Redis是什么: REmote DIctionary Server(远程字典服务器) 是完全开源免费的,用C语言编写的,遵守BSD协议,是一个高性能的(Key-Value)分布式内存数据库。 基于内存运行并支持持久化的NoSQL数据库,是当前最热门的NoSQL数据库之一, 阅读全文
posted @ 2019-02-23 10:50 阿布_alone 阅读(457) 评论(0) 推荐(0) 编辑
摘要: 直接参考官网:https://www.joinquant.com/ 官网的比较详细,看一下就ok了 补一张图: 阅读全文
posted @ 2019-02-22 21:56 阿布_alone 阅读(1524) 评论(0) 推荐(0) 编辑
摘要: 一、安装redis 第一步:下载redis安装包 wget http://download.redis.io/releases/redis-4.0.6.tar.gz [root@iZwz991stxdwj560bfmadtZ local]# wget http://download.redis.io 阅读全文
posted @ 2019-02-21 23:24 阿布_alone 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 一.TuShare简介和环境安装 二.Tushare的应用 我们主要还是应该掌握如何用tushare获取股票行情数据,使用的是ts.get_hist_data()函数或者ts.get_k_data()函数。输入参数为: code:股票代码,即6位数字代码,或者指数代码(sh=上证指数 sz=深圳成指 阅读全文
posted @ 2019-02-21 21:21 阿布_alone 阅读(1916) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-02-20 22:49 阿布_alone 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-02-20 21:29 阿布_alone 阅读(140) 评论(0) 推荐(0) 编辑
上一页 1 ··· 34 35 36 37 38 39 40 41 42 ··· 49 下一页
TOP