2019 年 1月随笔档案 - andy_1

时间指标的细化

摘要：阅读全文

posted @ 2019-01-31 14:41 andy_1 阅读(211) 评论(0) 推荐(0) 编辑

sklearn.model_selection模块

摘要：后续补代码 sklearn.model_selection模块的几个方法参数阅读全文

posted @ 2019-01-24 13:39 andy_1 阅读(564) 评论(0) 推荐(0) 编辑

K最近邻kNN-学习笔记

摘要：# 0.98 改进点： 1. 根据最近的K个值的距离对最终结果，进行加权。 2. 通过先验知识，对训练数据进行筛选，缩小训练样本，提高样本质量，有利于提高计算速度。 3. 变量尽量少，这样可以提供速度。优点： 1. 算法原理非常简单：用欧式距离最近（或曼哈顿距离）的K个样本点的分类中的众数，阅读全文

posted @ 2019-01-24 09:49 andy_1 阅读(260) 评论(0) 推荐(0) 编辑

随机森林学习-sklearn

摘要：随机森林的Python实现 (RandomForestClassifier) #有意思的输出clf.feature_importances_ # 输出自变量的总要程度clf.predict_proba(test[features]) #输出每个测试样本对应几种数据类型的概率值 150个数据，112 阅读全文

posted @ 2019-01-23 10:07 andy_1 阅读(1839) 评论(0) 推荐(0) 编辑

matplotlib画堆叠条形图

摘要：plt.style.use("ggplot") #设置图片风格为ggplot plt.rcParams['figure.dpi'] = 100 #分辨率阅读全文

posted @ 2019-01-21 16:17 andy_1 阅读(1413) 评论(0) 推荐(0) 编辑

PCA和SVD最佳理解

摘要：奇异值分解(SVD)原理与在降维中的应用 https://www.cnblogs.com/pinard/p/6251584.html 最通俗易懂的PCA主成分分析推导 https://blog.csdn.net/u012526436/article/details/80868294，https:// 阅读全文

posted @ 2019-01-21 13:57 andy_1 阅读(625) 评论(0) 推荐(0) 编辑

linux unzip 中文乱码解决方法

摘要：引自；https://blog.csdn.net/abyjun/article/details/48344379 unzip -O CP936 xxx.zip (用GBK, GB18030也可以) 阅读全文

posted @ 2019-01-21 11:39 andy_1 阅读(852) 评论(0) 推荐(0) 编辑

python文件、文件夹操作OS模块

摘要：转自：python文件、文件夹操作OS模块 '''一、python中对文件、文件夹操作时经常用到的os模块和shutil模块常用方法。1.得到当前工作目录，即当前Python脚本工作的目录路径: os.getcwd()2.返回指定目录下的所有文件和目录名:os.listdir()3.函数用来删除一个阅读全文

posted @ 2019-01-21 11:34 andy_1 阅读(377) 评论(0) 推荐(0) 编辑

利用pyecharts做地图数据展示

摘要：首先， pip install pyecharts 为了地图上的数据能显示完全，加载好需要的城市地理坐标数据。 pip install echarts-countries-pypkg pip install echarts-china-provinces-pypkg pip install echa 阅读全文

posted @ 2019-01-17 11:19 andy_1 阅读(8892) 评论(0) 推荐(0) 编辑

描述机器学习之神经网络算法原理

摘要：一、以小孩识别食物为例，描述机器学习之神经网络算法原理准备阶段：一个小孩（将使用的神经网络算法）刚出生（所有参数都是初始化的），对母乳以外的什么食物可以吃（怎样得到预测值）一无所知。准备好很多的多种多样的食物（训练数据的输入），每种食物幼童是否可以食用是恒定的（训练数据的输出），但是这个小孩不阅读全文

posted @ 2019-01-11 17:37 andy_1 阅读(533) 评论(0) 推荐(0) 编辑

python-pandas 高级功能（通过学习kaggle案例总结）

摘要：方法.iterrows()遍历循环df中的元素。 for index,row in df.iterrows(): pass 更改df一个元素中的变量值。 data1.set_value(index,'Random_Predict',1) 阅读全文

posted @ 2019-01-10 16:32 andy_1 阅读(447) 评论(0) 推荐(0) 编辑

python装饰器@用法

摘要：这个是我见过比较好的讲解链接： "【廖雪峰的官方网站装饰器】" 阅读全文

posted @ 2019-01-08 11:41 andy_1 阅读(141) 评论(0) 推荐(0) 编辑

mysql分组排序取最大值所在行，类似hive中row_number() over partition by

摘要：如下图，计划实现：按照 parent_code 分组，取组中code最大值所在的整条记录，如红色部分。（类似hive中： row_number() over(partition by)）个人理解， mysql 运行顺序： from >> where >> order by >> select 阅读全文

posted @ 2019-01-03 20:15 andy_1 阅读(5286) 评论(0) 推荐(0) 编辑

简明

01 2019 档案

时间指标的细化

sklearn.model_selection模块

K最近邻kNN-学习笔记

随机森林学习-sklearn

matplotlib画堆叠条形图

PCA和SVD最佳理解

linux unzip 中文乱码解决方法

python文件、文件夹操作OS模块

利用pyecharts做地图数据展示

描述机器学习之神经网络算法原理

python-pandas 高级功能（通过学习kaggle案例总结）

python装饰器@用法

mysql分组排序取最大值所在行，类似hive中row_number() over partition by

导航

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

文章分类

计算机

阅读排行榜

评论排行榜

推荐排行榜

最新评论