03 2020 档案

软著源码粘贴助手
摘要:文本文件汇集 阅读全文

posted @ 2020-03-20 18:35 耀扬 阅读(500) 评论(0) 推荐(0)

kaggle、天池比赛免费的GPU、TPU
摘要:最近在做天池的项目。刚入行,没有gpu,内存只有8g。i5的笔记本。可怜啊。隔三差五的就崩溃一次。千辛万苦算是把数据处理完了。可是计算模型,真的不敢想啊。 最快的是跑了一个决策树,10多分钟吧。还能接受。但是效果不太理想。xgboost斗胆试了一次,跑了8个小时,崩溃了。 寻求帮助吧。 百度的飞浆不 阅读全文

posted @ 2020-03-19 21:15 耀扬 阅读(5188) 评论(1) 推荐(2)

pandas缺失值填充时遇到的问题
摘要:打比赛时,遇到了一个问题。填充空白值的时候,如果使用 固定值,均值啥的都没问题。 但是我想用 但是每次都是报错 经过千辛万苦终于找到了问题的根源。 原来,我在加载数据的时候使用了一个 压缩内存的函数 这里面产生了一种新的数据类型 np.float16 而这种类型,在pandas里是没有的。 pand 阅读全文

posted @ 2020-03-18 23:28 耀扬 阅读(1691) 评论(0) 推荐(1)

pandas统计每一列缺失值函数
摘要:感谢 https://www.jianshu.com/p/9f583668f386 感谢 https://www.cnblogs.com/Mrzhang3389/p/11166800.html 阅读全文

posted @ 2020-03-14 22:28 耀扬 阅读(1024) 评论(0) 推荐(0)

pandas中滑窗rolling的使用
摘要:函数原型和参数说明 window:表示时间窗的大小,注意有两种形式(int or offset)。如果使用int,则数值表示计算统计量的观测值的数量即向前几个数据。如果是offset类型,表示时间窗的大小。 min_periods:最少需要有值的观测点的数量,对于int类型,默认与window相等。 阅读全文

posted @ 2020-03-07 14:41 耀扬 阅读(1121) 评论(0) 推荐(0)

压缩pandas中dataframe内存
摘要:从这里找的一个宝贝源码,可以大大缓解内存问题。https://www.kaggle.com/arjanso/reducing dataframe memory size by 65/code 阅读全文

posted @ 2020-03-06 23:02 耀扬 阅读(838) 评论(0) 推荐(0)

Pandas与SQL语句对照
摘要:Pandas与SQL语句对照 建立学生 课程数据库 表结构 student |字段名|类型|备注| | | | | |sno|char|学号| |sname|char|姓名| |ssex|bool|性别| |sage|int|年龄| |sdept|char|所在系| course |字段名|类型|备 阅读全文

posted @ 2020-03-06 16:18 耀扬 阅读(1648) 评论(0) 推荐(0)

excel导出csv按照utf8编码
摘要:导出excel为csv格式时候,无法按照utf8编码。千万不要用记事本。记事本在转码的时候会自动编上一个字头。 建议用 notepad或sublime text 来转码存储。 阅读全文

posted @ 2020-03-06 10:41 耀扬 阅读(1445) 评论(0) 推荐(0)

win10添加本地组策略技巧
摘要:记事本编辑一个文件 将上述文件保存后,保存为 .bat的文件。 右键运行即可 Win+R 打开运列显示框 输入 gpedit.msc 即可 阅读全文

posted @ 2020-03-05 17:31 耀扬 阅读(519) 评论(0) 推荐(0)

pandas读取文件内存压缩妙招
摘要:pandas读取csv文件体积太大。偶从网上发现一个好方法。就是缩小数字类型的位数。 例如:int64缩小到 int8那是最好了。依据他们的 取值范围 ,来选定数据类型。 压缩率老高了。 感谢一下 :光于前裕于后 https://blog.csdn.net/Dr_Guo/article/detail 阅读全文

posted @ 2020-03-05 15:09 耀扬 阅读(1263) 评论(0) 推荐(1)

pandas 日期时间数据的分割提取操作
摘要:参考 https://blog.csdn.net/weixin_44663675/article/details/101030800 阅读全文

posted @ 2020-03-04 13:47 耀扬 阅读(7283) 评论(0) 推荐(0)

数据分析常用数据集下载
摘要:经常用到数据分析常用的数据集,收集挺麻烦的。取之于网络,还之于人民 |数据集名称|下载地址|数据集介绍| | | | | |天池二手车价格预测|链接:https://pan.baidu.com/s/1n3qRxNhmmUMugkYiFSTKQQ 提取码:66ri|| |用户对品类下店铺的购买预测|链 阅读全文

posted @ 2020-03-03 21:35 耀扬 阅读(12387) 评论(0) 推荐(2)

数据分析之KAGGLE-泰坦尼克号人员生存预测问题
摘要:本文参考 handsye https://blog.csdn.net/handsye/article/details/83999641 对部分内容进行了修正和整理 数据分析之KAGGLE 泰坦尼克号人员生存预测问题 分析目的 完成对什么样的人可能生存的分析。 数据说明 |特征|描述| | || |s 阅读全文

posted @ 2020-03-03 17:58 耀扬 阅读(1003) 评论(0) 推荐(0)

【Tensorflow】Darknet的yolov3.weights文件转换成tensorflow的ckpt或者pb文件
摘要:原文地址:https://blog.csdn.net/heiheiya/article/details/91437196 感谢 heiheiya 。 做个学习笔记 一、下载源码 git clone https://github.com/mystic123/tensorflow-yolo-v3.git 阅读全文

posted @ 2020-03-03 13:49 耀扬 阅读(3398) 评论(0) 推荐(0)

jupyter 常用快捷方式
摘要:|命令|功能| | | | |Ctrl+enter|执行本cell| |alt+enter|执行本cell且 向下建立一个新cell| |esc+m|m 把cell切换至markdown模式| |esc+y|y 把cell切换至code模式| |a|在上方新建cell , 命令模式| |b|在下方新 阅读全文

posted @ 2020-03-03 12:17 耀扬 阅读(203) 评论(0) 推荐(0)

jupyter代码自动补全等常用扩展功能
摘要:1.代码补全 先要关闭 jupyter!!! 运行下面两行代码 启动jyputer 2. 代码导航 勾选Table of Contents 启用插件 你用Markdown写的注解,居然有类似word的导航图。 3. 变量检查器 勾选Variable Inspector 启用插件 啥也不说了,此功能必 阅读全文

posted @ 2020-03-03 10:15 耀扬 阅读(1124) 评论(0) 推荐(0)

最全模型实战Pima印第安人数据集上的机器学习-分类算法(逻辑回归、朴素贝叶斯、K近邻、决策树、支持向量机、xgboost、lightgbm)
摘要:本文主要参考自 爱吃串串的瘦子 https://blog.csdn.net/weixin_41988628/article/details/83051712 易悠 https://blog.csdn.net/yizheyouye/article/details/79791473 对部分内容进行了修正 阅读全文

posted @ 2020-03-02 21:32 耀扬 阅读(2440) 评论(0) 推荐(0)

leetcode42题接雨水解题
摘要:leetcode42题 接雨水 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。 上面是由数组 [0,1,0,2,1,0,1,3,2,1,2,1] 表示的高度图,在这种情况下,可以接 6 个单位的雨水(蓝色部分表示雨水) 解题思路 刚一看题,马上就想 阅读全文

posted @ 2020-03-02 16:37 耀扬 阅读(1776) 评论(0) 推荐(0)

数据分析训练-Pima印第安人数据集上的机器学习-分类算法(根据诊断措施预测糖尿病的发病)
摘要:本文主要内容摘自 易悠 博主的 Pima印第安人数据集上的机器学习 分类算法(根据诊断措施预测糖尿病的发病) https://blog.csdn.net/yizheyouye/article/details/79791473 在一些地方做了补充说明,便于小白理解。 数据集简介 该数据集最初来自国家糖 阅读全文

posted @ 2020-03-01 23:06 耀扬 阅读(4293) 评论(0) 推荐(0)

导航