01 2019 档案

时间指标的细化
摘要: 阅读全文

posted @ 2019-01-31 14:41 andy_1 阅读(211) 评论(0) 推荐(0) 编辑

sklearn.model_selection模块
摘要:后续补代码 sklearn.model_selection模块的几个方法参数 阅读全文

posted @ 2019-01-24 13:39 andy_1 阅读(564) 评论(0) 推荐(0) 编辑

K最近邻kNN-学习笔记
摘要:# 0.98 改进点: 1. 根据最近的K个值 的距离对最终结果,进行加权。 2. 通过先验知识,对训练数据进行筛选,缩小训练样本,提高样本质量,有利于提高计算速度。 3. 变量尽量少,这样可以提供速度。 优点: 1. 算法原理非常简单: 用 欧式距离最近(或曼哈顿距离)的K个样本点的分类中的众数, 阅读全文

posted @ 2019-01-24 09:49 andy_1 阅读(260) 评论(0) 推荐(0) 编辑

随机森林学习-sklearn
摘要:随机森林的Python实现 (RandomForestClassifier) #有意思的输出clf.feature_importances_ # 输出 自变量的总要程度clf.predict_proba(test[features]) #输出每个测试样本对应几种数据类型的概率值 150个数据,112 阅读全文

posted @ 2019-01-23 10:07 andy_1 阅读(1839) 评论(0) 推荐(0) 编辑

matplotlib画堆叠条形图
摘要:plt.style.use("ggplot") #设置图片风格为ggplot plt.rcParams['figure.dpi'] = 100 #分辨率 阅读全文

posted @ 2019-01-21 16:17 andy_1 阅读(1413) 评论(0) 推荐(0) 编辑

PCA和SVD最佳理解
摘要:奇异值分解(SVD)原理与在降维中的应用 https://www.cnblogs.com/pinard/p/6251584.html 最通俗易懂的PCA主成分分析推导 https://blog.csdn.net/u012526436/article/details/80868294,https:// 阅读全文

posted @ 2019-01-21 13:57 andy_1 阅读(625) 评论(0) 推荐(0) 编辑

linux unzip 中文乱码解决方法
摘要:引自;https://blog.csdn.net/abyjun/article/details/48344379 unzip -O CP936 xxx.zip (用GBK, GB18030也可以) 阅读全文

posted @ 2019-01-21 11:39 andy_1 阅读(852) 评论(0) 推荐(0) 编辑

python文件、文件夹操作OS模块
摘要:转自:python文件、文件夹操作OS模块 '''一、python中对文件、文件夹操作时经常用到的os模块和shutil模块常用方法。1.得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()2.返回指定目录下的所有文件和目录名:os.listdir()3.函数用来删除一个 阅读全文

posted @ 2019-01-21 11:34 andy_1 阅读(377) 评论(0) 推荐(0) 编辑

利用pyecharts做地图数据展示
摘要:首先, pip install pyecharts 为了地图上的数据能显示完全,加载好需要的城市地理坐标数据。 pip install echarts-countries-pypkg pip install echarts-china-provinces-pypkg pip install echa 阅读全文

posted @ 2019-01-17 11:19 andy_1 阅读(8892) 评论(0) 推荐(0) 编辑

描述机器学习之神经网络算法原理
摘要:一、以小孩识别食物为例,描述机器学习之神经网络算法原理 准备阶段: 一个小孩(将使用的神经网络算法)刚出生(所有参数都是初始化的),对母乳以外的什么食物可以吃(怎样得到预测值)一无所知。 准备好很多的多种多样的食物(训练数据的输入),每种食物幼童是否可以食用是恒定的(训练数据的输出),但是这个小孩不 阅读全文

posted @ 2019-01-11 17:37 andy_1 阅读(533) 评论(0) 推荐(0) 编辑

python-pandas 高级功能(通过学习kaggle案例总结)
摘要:方法.iterrows()遍历循环df中的元素。 for index,row in df.iterrows(): pass 更改df一个元素中的变量值。 data1.set_value(index,'Random_Predict',1) 阅读全文

posted @ 2019-01-10 16:32 andy_1 阅读(447) 评论(0) 推荐(0) 编辑

python装饰器@用法
摘要:这个是我见过比较好的讲解链接: "【廖雪峰的官方网站 装饰器】" 阅读全文

posted @ 2019-01-08 11:41 andy_1 阅读(141) 评论(0) 推荐(0) 编辑

mysql分组排序取最大值所在行,类似hive中row_number() over partition by
摘要:如下图, 计划实现 :按照 parent_code 分组, 取组中code最大值所在的整条记录,如红色部分。(类似hive中: row_number() over(partition by)) 个人理解, mysql 运行顺序: from >> where >> order by >> select 阅读全文

posted @ 2019-01-03 20:15 andy_1 阅读(5286) 评论(0) 推荐(0) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示