2019 年 6月随笔档案 - 青红*皂了个白

深度学习之TensorFlow

摘要：TensorFlow在win下可以使用pip安装，pip install TensorFlow 通常分为GPU版和CPU版，有独立显卡的情况下，推荐使用GPU,GPU在处理数据运算方面更优于CPU，从专业的角度看，使用源码安装可以开启加速。作为机器学习中更专业的技术，当然还会依赖继续学习中的类库，阅读全文

posted @ 2019-06-26 22:17 青红*皂了个白阅读(248) 评论(0) 推荐(0) 编辑

随机森林的使用

摘要：调用方法来实现：如果想查看决策树的结构，可以使用可视化工具将其转化为图片 graphviz win安装直接exe就行了，安装完成，需要将bin目录配置到path环境变量中去。即可执行dot命令。阅读全文

posted @ 2019-06-22 12:20 青红*皂了个白阅读(359) 评论(0) 推荐(0) 编辑

kaggle平台的配置与使用

摘要：Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆（Anthony Goldbloom）2010年在墨尔本创立的，主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。很多数据样本可以从该平台获取。类似于Githup. 想获取上面的数据则需要一个账号。目前只支持Fa 阅读全文

posted @ 2019-06-16 14:46 青红*皂了个白阅读(3645) 评论(0) 推荐(0) 编辑

pycharm的安装与配置

摘要：关于pycharm,作为Python开发的利器，功能强悍就不多说了。安装：尝试当前最新版2018.3.6 官网下载地址：http://www.jetbrains.com/pycharm/?fromMenu 或者选择下载 3.5安装升级至3.6 ：http://soft.onlinedown.ne 阅读全文

posted @ 2019-06-15 00:18 青红*皂了个白阅读(701) 评论(0) 推荐(0) 编辑

机器学习

摘要：结构=特征值+目标值数据降维：阅读全文

posted @ 2019-06-14 12:10 青红*皂了个白阅读(109) 评论(0) 推荐(0) 编辑

对股票的双均线策略

摘要：双均线：此处采用5日均线和30日均线金叉：短均线上穿长均线 5日线上穿30日线，交叉处为金叉 5日线<30日线由true >false 死叉：短均线下穿长均线 5日线下穿30日线，交叉处为死叉由false >true 具体实现代码：阅读全文

posted @ 2019-06-10 15:26 青红*皂了个白阅读(953) 评论(0) 推荐(0) 编辑

元素过滤

摘要：关于过滤的配合使用： notnull 配合all isnull配合any 比如：对下列数据过滤获取有用数据方法一：空值排除法直接调用dropna方法去执行空值去除方法二：用当前值进行填充去除行元素重复：关于替换操作： map的映射与计算：对多表数据进行拼接：阅读全文

posted @ 2019-06-08 08:56 青红*皂了个白阅读(199) 评论(0) 推荐(0) 编辑

数据分析

摘要：数据分析三剑客：Numpy Pandas Matplotlib 二维数组取值： attr=np.random.randint(0,100,size=(5,6)) attr[[1,2]] #取数组中的1行到2行 atr[0:3] #从第一行到第三行 attr[;,2:4] #从第3列到第4列关于数组阅读全文

posted @ 2019-06-06 11:39 青红*皂了个白阅读(209) 评论(0) 推荐(0) 编辑

提高scrapy的爬取效率

摘要：增加并发：默认scrapy开启的线程数为32个，可以适当进行增加，在seeting配置文件中修改councurrent_requests=100 降低日志等级：在运行scrapy运行时，会有大量日志输出，为了减少cpu的使用率，可将日志等级设置为log=error或log=info 禁用cook 阅读全文

posted @ 2019-06-04 12:17 青红*皂了个白阅读(332) 评论(0) 推荐(0) 编辑

关于使用selenium鼠标移动加载全部页面数据

摘要：此处采用函数执行鼠标滑动操作，最终完成动态数据的加载（懒加载）原理：设置一个空列表用于存储每次鼠标拖动后的瞬间页面最大高度。每次追加页面的最新高度在每次拖动后，重新去获取一下，当前页面的最大高度如果获取的页面最大高度等于了列表最后的那个最大高度，说明页面到底了，跳出循环。否则会将当前获取的阅读全文

posted @ 2019-06-03 18:22 青红*皂了个白阅读(796) 评论(0) 推荐(0) 编辑

scrapy框架之中间件Middleware

摘要：scrapy框架的中间件主要有两个，一个是spiderMiddleware(爬虫中间件)，一个是DownloaderMiddleware(下载中间件) 通常由于在请求对象和相应对象数据在下载中间件就能处理好，一般不会去使用爬虫中间件。下载中间件主要用到的方法有三个： process_request 阅读全文

posted @ 2019-06-03 10:55 青红*皂了个白阅读(309) 评论(0) 推荐(0) 编辑

scrapy实现post请求与请求传参

摘要：不推荐使用scrapy框架发送post请求，配置复杂，如果在数据量大的情况下，可以通过如下代码来实现：方法一：就是重写scrapy下面的start_requests方法方法二：将URL链接写在外部，然后手动去发送请求 scrapy.FormRequest(url=url,formdata=da 阅读全文

posted @ 2019-06-01 16:54 青红*皂了个白阅读(8975) 评论(0) 推荐(1) 编辑

青红*皂了个白

06 2019 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论