everda

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2019年11月12日

摘要: user guide https://scikit-learn.org/stable/user_guide.html 1. 监督式学习(Supervised learning) 1.1. 广义线性模型(Generalized Linear Models) 1.2. 线性和二次判别分析(Linear 阅读全文
posted @ 2019-11-12 21:02 everda 阅读(612) 评论(0) 推荐(0) 编辑

摘要: 一、原理阐述 算法类型:非监督学习_聚类算法 输入: 连续型 V1.0 给定需要分为k个分类,随机选择k个点作为中心点,计算每个点离这k个中心点的距离,将距离最小的作为该点的分类;再利用均值等计算这k个分类的新中心点,重复上面的计算,直到每个点的分类不再变化或迭代次数大于一定阈值结束。 二、算法选择 阅读全文
posted @ 2019-11-12 19:57 everda 阅读(171) 评论(0) 推荐(0) 编辑

2019年9月26日

摘要: 注:为了能系统性学习pandas,我这篇文章将会根据官网的文档结构结合工作中需求场景进行梳理。目的有三,一是尽量介绍全面,二是核心是能解决工作的需求,三是在特定需求下也能快速找到官网中的解决办法。 注:一般很少用series,以下一般只看dataframe。 官网:https://pandas.py 阅读全文
posted @ 2019-09-26 21:15 everda 阅读(351) 评论(0) 推荐(0) 编辑

2019年8月20日

摘要: 一、背景 收到一个小需求,某项目会上传了很多图片,产品想看看用户上传的图片都是啥。 线上业务表里存了图片url和一些用户ID信息,需要将图片都下载下来并以日期_用户ID等信息命名。起初想的是先输hive服务器地址和账密,执行查询url等信息SQL存在列表里,再遍历列表挨个下载图片。然而我也不知道hi 阅读全文
posted @ 2019-08-20 18:59 everda 阅读(3377) 评论(0) 推荐(0) 编辑

2019年8月13日

摘要: 一、V1.0(sklearn版) 1.1简易API 1.2复杂API 目的是尽量全。 1.3API资料 目的是前面不满足使用或不太理解可以从这里获得灵感。 阅读全文
posted @ 2019-08-13 19:32 everda 阅读(185) 评论(0) 推荐(0) 编辑

摘要: 一、原理阐述 算法类型:监督学习_分类算法 输入:数值型或标称型(标称型需要独热编码) V1.0 用回归方式解决二分类问题,通过引入一个Sigmoid函数将中间y值映射到实际二分类的y值上。 二、算法选择 三、算法过程 1.Sigmoid函数是一个x值域是(-∞,+∞),y值域是(0,1)的单调递增 阅读全文
posted @ 2019-08-13 19:23 everda 阅读(174) 评论(0) 推荐(0) 编辑

摘要: python sklearn包——混淆矩阵、分类报告等自动生成 https://blog.csdn.net/u010454729/article/details/50769034 阅读全文
posted @ 2019-08-13 15:45 everda 阅读(539) 评论(0) 推荐(0) 编辑

摘要: 1. 分类模型评估 sklearn有三种方式评估一个模型的预测质量, 1)各模型模块都有一个score方法; 2)cross-validation模块有评估工具; 3)metrics模块有一些评估函数。 这里提供metrics模块API,其他参见参考资料。 #对测试集进行预测 y_predict = 阅读全文
posted @ 2019-08-13 15:34 everda 阅读(280) 评论(0) 推荐(0) 编辑

2019年8月12日

摘要: 编码 独热编码 基于树的算法不需要独热编码。 1.pandas方法 from sklearn.datasets import load_iris import pandas as pd #创建数据集 data = pd.DataFrame({'one':[1,2,3],'two':[2,3,4],' 阅读全文
posted @ 2019-08-12 19:18 everda 阅读(258) 评论(0) 推荐(0) 编辑

2019年8月8日

摘要: 一、背景 在写Python代码时通常有一些场景需要一些简单的函数实现,但这些函数也不是那么需要在基础篇看,因为其实help一下就知道怎么用了。但看英文的help文档总是费劲的,所以就在杂篇系列里开一篇汇总相关内容,碰到一个总结一个,便于后续直接搜函数名就可以快速回顾。 二、常用函数/类 1.enum 阅读全文
posted @ 2019-08-08 19:52 everda 阅读(281) 评论(0) 推荐(0) 编辑