2017年12月25日

ROC曲线的计算

摘要: 1、ROC曲线简介 在评价分类模型时,会用到ROC(receiver operating characteristic)曲线。ROC曲线可用来评价二元分类器( binary classifier)的优劣,如下图: 假设我们的样本分为正(positive)、负(negative)两类, x轴false 阅读全文

posted @ 2017-12-25 20:41 royhoo 阅读(9613) 评论(0) 推荐(0) 编辑

2017年12月14日

梯度下降求解线性回归

摘要: 本文主要翻译自An Introduction to Gradient Descent and Linear Regression,原文写的通俗易懂,在文章最后还不忘推荐了一下吴恩达的机器学习课程。我不打算逐字逐句翻译,毕竟老外废话太多。 线性回归可以用最小二乘法直接求解。这里之所以选择线性回归的例子 阅读全文

posted @ 2017-12-14 23:19 royhoo 阅读(1026) 评论(1) 推荐(0) 编辑

2017年12月11日

Ames房价预测特征工程

摘要: 最近学人工智能,讲到了Kaggle上的一个竞赛任务,Ames房价预测 。本文将描述一下数据预处理和特征工程所进行的操作,具体代码Click Me。 原始数据集共有特征81个,数值型特征38个,非数值型特征43个。有很多缺失值。 1、离群点检测 以GrLivArea(地上面积)和SalePrice(房 阅读全文

posted @ 2017-12-11 00:50 royhoo 阅读(1750) 评论(0) 推荐(0) 编辑

2017年11月18日

概率与统计推断第二讲homework

摘要: 作业目的: 体会条件独立 1、现需要设计一个根据一个人是否是学生$S$(布尔变量)和其体重$W$(连续变量)判断该人的性别$G$(布尔变量)。假设在给定$G$的情况下$S$和$W$独立,且假设概率分布 $p(W|G=female)$和$p(W|G=male)$为高斯分布且二者的方差相等。(a)可以用 阅读全文

posted @ 2017-11-18 11:49 royhoo 阅读(203) 评论(0) 推荐(0) 编辑

2017年11月16日

概率与统计推断第一讲homework

摘要: 1. 假设在考试的多项选择中,考生知道正确答案的概率为$p$,猜测答案的概率为$1-p$,并且假设考生知道正确答案答对题的概率为1,猜中正确答案的概率为$\frac{1}{m}$,其中$m$为多选项的数目。那么已知考生答对题目,求他知道正确答案的概率。 记事件$A$为考生答对题,事件$B$为考生知道 阅读全文

posted @ 2017-11-16 19:07 royhoo 阅读(346) 评论(0) 推荐(0) 编辑

2017年8月30日

idea运行多模块的maven项目,工作目录不一致的问题

摘要: 我使用idea开发多模块的maven项目,目录结构如下: segment (父级) pom.xml core (子模块) pom.xml optimize (子模块) pom.xml 其中,segment是父级,core和optimize是两个子模块。 在optimize中,我有两种方式运行程序:1 阅读全文

posted @ 2017-08-30 22:05 royhoo 阅读(1337) 评论(0) 推荐(0) 编辑

2017年7月29日

常用网址

摘要: 算法: http://mindhacks.cn 阅读全文

posted @ 2017-07-29 14:40 royhoo 阅读(173) 评论(0) 推荐(0) 编辑

2017年4月27日

数独游戏求解程序

摘要: 最近玩数独游戏,每行、每列、以及9宫格都包含1-9个数组。觉得这东西很适合用程序来求解。于是我就仿照中国象棋的暴力搜索算法(可参考我之前写的文章极大极小搜索算法),写了一个程序求解数独,直接贴代码了(以上传至github) 阅读全文

posted @ 2017-04-27 23:34 royhoo 阅读(727) 评论(0) 推荐(0) 编辑

2017年4月15日

ansj人名识别

摘要: 1、前言 ansj人名识别会用到两个字典,分别是:person/asian_name_freq.data、person/person.dic。 1.1、asian_name_freq.data 这是一个二进制文件,序列化了一个Map对象。该对象的key为词,value是大小为3的数组。例如: 罗=[ 阅读全文

posted @ 2017-04-15 23:57 royhoo 阅读(3120) 评论(0) 推荐(0) 编辑

2017年3月31日

ansj构造最短路径

摘要: 一、前言 上节介绍了ansj的原子切分和全切分。切分完成之后,就要构建最短路径,得到分词结果。 以“商品和服务”为例,调用ansj的标准分词: String str = "商品和服务" ; Result result = ToAnalysis.parse(str); System.out.print 阅读全文

posted @ 2017-03-31 21:06 royhoo 阅读(1098) 评论(0) 推荐(0) 编辑

导航