摘要: 能评价: 分类任务可以分为两个子集:“相关的”、“不相关的”。 精确率:“相关的”子集中的正确的样本的比例。 召回率:实际“相关的”子集中正确标注的样本的比例。 精确率:$P = \frac{tp}{tp+fp}$ 正样本中有多少被分类为正样本 召回率:$R = \frac{tp}{tp+fn}$ 阅读全文
posted @ 2017-04-27 14:53 江小修 阅读(289) 评论(0) 推荐(0) 编辑
摘要: 树的节点将要预测的空间划分为一系列简单域,划分预测空间的规则可以被建模为一棵树,所以这种方法也叫决策树方法。 bagging,随机森林,boosting 是多棵决策树组合起来采用投票方式产生一个预测结果的方法。 以树为基础的方法可以用于回归和分类。 回归树: 输出是一个实数,如房子的价格等。 回归树 阅读全文
posted @ 2017-04-24 14:16 江小修 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 自然语言处理中的标注任务与机器学习 阅读全文
posted @ 2017-04-20 16:05 江小修 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 判别式算法:直接对p(y|x)建模,或者直接求$h_\theta(x)$得到y的值。 生成算法: 根据类别,对特征进行建模,即对p(x|y)建模,再结合先验概率p(y),得到p(y|x) 阅读全文
posted @ 2017-04-19 00:52 江小修 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 一般来说,回归是不用于分类的,因为回归是连续的,受噪声影响较大。为了能够处理分类问题,引入了逻辑回归。 逻辑回归本质上来说还是线性回归,他只是在线性回归的基础上加了一个映射函数。 假设函数:$h_\theta\left(x\right) = g\left(\theta^T x \right) = \ 阅读全文
posted @ 2017-04-18 02:09 江小修 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 函数、符号及特殊字符 声调 函数 同余 微分 集合 逻辑 根号 关系符号 \begin{align} \because\begin{cases} \acute{a}x^2+bx^2+c\gtrless0\gtrless\grave{a}x^2+bx^2+c\\ \acute{a}>0>\grave{ 阅读全文
posted @ 2017-04-15 20:27 江小修 阅读(425) 评论(0) 推荐(0) 编辑
摘要: 机器学习的典型的学习过程是:首先给出一个输入数据,学习算法就是要学得一个估计的函数,这个函数能对未知数据给出一个估计,这也称为构建一个模型。 线性回归是假设特征和结果满足线性关系。 估计函数:$h\left(x\right)=h_\theta\left(x\right)=\theta_0+\thet 阅读全文
posted @ 2017-04-15 16:12 江小修 阅读(113) 评论(0) 推荐(0) 编辑