摘要: 在本节中,我们介绍Softmax回归模型,该模型是logistic回归模型在多分类问题上的推广,在多分类问题中,类标签 可以取两个以上的值。 Softmax回归模型对于诸如MNIST手写数字分类等问题是很有用的,该问题的目的是辨识10个不同的单个数字。Softmax回归是有监督的,不过后面也会介绍它 阅读全文
posted @ 2018-08-23 22:33 IronJJ 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 指数分布族 如果一类分布可以写成如下的形式,那么它就是属于指数分布族的: P(y;η) = b(y)exp(ηTT(y) - a(η)) (1) 这里η叫做分布的自然参数(natural parameter),或者叫标准参数(canonical parameter);T(y)是充分统计量( suff 阅读全文
posted @ 2018-08-23 22:28 IronJJ 阅读(391) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2018-04-22 11:40 IronJJ 阅读(137) 评论(0) 推荐(0) 编辑
摘要: 数据分类数据分类就是建立模型把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征来对数据进行区别。这个模型称为分类器,预测分类的(无序,离散)类标号。数据分类通常分为两个过程,学习阶段(模型构建)和分类阶段(预测类标号)。例如下图我们预测客户是否会购买计算... 阅读全文
posted @ 2018-03-29 21:25 IronJJ 阅读(2761) 评论(0) 推荐(0) 编辑
摘要: 数据离散化数据离散化的一种常用方法是依据数据的相关性程度进行离散化,最常见的算法就是ChiMerge算法定义chimerge是基于chi-squre的,监督的,自底向上(合并的)一种数据离散化方法。卡方检验 xyz Ax1y1z1aBx2y2z2b xyzN统计AB属... 阅读全文
posted @ 2018-03-17 17:23 IronJJ 阅读(3410) 评论(1) 推荐(0) 编辑
摘要: 如果公司在Github建立了私有服务器,项目进行中需要多人多地协同工作。这时需要一套完整规范的代码提交流程。分享一下我们的经验。第一步建立中央仓库upstream,然后建立fork:Click the Fork button on the original repos... 阅读全文
posted @ 2018-01-07 11:48 IronJJ 阅读(815) 评论(0) 推荐(0) 编辑
摘要: - 在本地, 打开目标 repo 的 .git/config 文件, 找到 `[remote "orgin"]`, 在其下添加或修改一行:`fetch = +refs/pull/*/head:refs/pull/origin/*`- 执行 `git fetch ori... 阅读全文
posted @ 2018-01-07 11:40 IronJJ 阅读(332) 评论(0) 推荐(0) 编辑
摘要: Environment:1. Win 7 (64-bit)2. Python 2.73. VS 2017 Community4. Git for WindowsBuild NodeJS从Github上下载Nodejs源码git clone https://github... 阅读全文
posted @ 2018-01-02 15:12 IronJJ 阅读(2170) 评论(0) 推荐(0) 编辑
摘要: Jar包没有main class。启动阻塞,直到JVM启动,Python才会尝试连接java_server = JavaGateway.launch_gateway(java_path=__java_home, classpath=__class_path, die_... 阅读全文
posted @ 2017-10-18 10:22 IronJJ 阅读(221) 评论(0) 推荐(0) 编辑
摘要: Hadoop配置文件管理Hadoop的配置文件有很多,主要由以下几个:在早期的版本中这些文件位于hadoop/conf下面,hadoop0.20.2的版本中,这些文件在hadoop/etc/hadoop/下面。Hadoop的master和slave节点,均可以采用想吐... 阅读全文
posted @ 2016-03-11 10:21 IronJJ 阅读(137) 评论(0) 推荐(0) 编辑