摘要: 一 roc曲线 1、roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。 横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity 阅读全文
posted @ 2017-08-10 11:42 嗷山 阅读(350) 评论(0) 推荐(0) 编辑
摘要: 作者:Yeung Evan链接:https://www.zhihu.com/question/54082000/answer/145495695来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 在英语语境里,likelihood 和 probability 的日常使用是 阅读全文
posted @ 2017-07-04 14:04 嗷山 阅读(337) 评论(0) 推荐(0) 编辑
摘要: Sigmoid函数由下列公式定义 sigmoid函数是一个良好的阈值函数, 连续 光滑 严格单调 关于(0,0.5)中心对称 在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0,1之间。 sigmoid函数是一个良好的阈值函数, 连续 光滑 严 阅读全文
posted @ 2017-06-28 17:53 嗷山 阅读(1425) 评论(0) 推荐(0) 编辑
摘要: Hive中提供了越来越多的分析函数,用于完成负责的统计分析。 今天简单整理一下,以务以后自己快速查询,也给看到的朋友作个参考。 分析函数主要用于实现分组内所有和连续累积的统计。 一. AVG,MIN,MAX,和SUM 如果不指定ROWS BETWEEN,默认为从起点到当前行; 如果不指定ORDER 阅读全文
posted @ 2017-06-28 15:44 嗷山 阅读(3427) 评论(0) 推荐(1) 编辑
摘要: 版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com 前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一种解释。特征值和奇异值在大部分人的 阅读全文
posted @ 2017-06-16 16:22 嗷山 阅读(512) 评论(0) 推荐(0) 编辑
摘要: 数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一 阅读全文
posted @ 2017-06-16 16:18 嗷山 阅读(28434) 评论(0) 推荐(2) 编辑
摘要: 一、常用链接: 1.Python官网:https://www.python.org/2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn 一、常用链接: 3.数据分析常用库的离线安装包(pip+wheels)(百 阅读全文
posted @ 2017-06-13 11:48 嗷山 阅读(343) 评论(0) 推荐(0) 编辑
摘要: 通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。以后有时间再对单个算法做深入地解析。 今天的算法如下: 1. 决策树 根据一些 fe 阅读全文
posted @ 2017-05-11 09:59 嗷山 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密。这个可能是我做技术研究的思路有关,我开始学习某一套技术总是想着这套技术到底能干什么,只有当我真正理解了这套技 阅读全文
posted @ 2017-05-10 14:36 嗷山 阅读(505) 评论(0) 推荐(0) 编辑
摘要: 命令基本格式: 1.ls 列出hdfs文件系统根目录下的目录和文件 列出hdfs文件系统所有的目录和文件 2.put hdfs file的父目录一定要存在,否则命令不会执行 hdfs dir 一定要存在,否则命令不会执行 从键盘读取输入到hdfs file中,按Ctrl+D结束输入,hdfs fil 阅读全文
posted @ 2017-05-05 11:13 嗷山 阅读(586) 评论(0) 推荐(0) 编辑