江小修

2017年4月27日

摘要：能评价：分类任务可以分为两个子集：“相关的”、“不相关的”。精确率：“相关的”子集中的正确的样本的比例。召回率：实际“相关的”子集中正确标注的样本的比例。精确率：$P = \frac{tp}{tp+fp}$ 正样本中有多少被分类为正样本召回率：$R = \frac{tp}{tp+fn}$ 阅读全文

posted @ 2017-04-27 14:53 江小修阅读(289) 评论(0) 推荐(0) 编辑

2017年4月24日

决策树

摘要：树的节点将要预测的空间划分为一系列简单域，划分预测空间的规则可以被建模为一棵树，所以这种方法也叫决策树方法。 bagging，随机森林，boosting 是多棵决策树组合起来采用投票方式产生一个预测结果的方法。以树为基础的方法可以用于回归和分类。回归树：输出是一个实数，如房子的价格等。回归树阅读全文

posted @ 2017-04-24 14:16 江小修阅读(242) 评论(0) 推荐(0) 编辑

2017年4月20日

自然语言处理

摘要：自然语言处理中的标注任务与机器学习阅读全文

posted @ 2017-04-20 16:05 江小修阅读(117) 评论(0) 推荐(0) 编辑

2017年4月19日

生成算法

摘要：判别式算法：直接对p(y|x)建模，或者直接求$h_\theta(x)$得到y的值。生成算法：根据类别，对特征进行建模，即对p(x|y)建模，再结合先验概率p(y)，得到p(y|x) 阅读全文

posted @ 2017-04-19 00:52 江小修阅读(244) 评论(0) 推荐(0) 编辑

2017年4月18日

logistic regression

摘要：一般来说，回归是不用于分类的，因为回归是连续的，受噪声影响较大。为了能够处理分类问题，引入了逻辑回归。逻辑回归本质上来说还是线性回归，他只是在线性回归的基础上加了一个映射函数。假设函数：$h_\theta\left(x\right) = g\left(\theta^T x \right) = \ 阅读全文

posted @ 2017-04-18 02:09 江小修阅读(217) 评论(0) 推荐(0) 编辑

2017年4月15日

Latex

摘要：函数、符号及特殊字符声调函数同余微分集合逻辑根号关系符号 \begin{align} \because\begin{cases} \acute{a}x^2+bx^2+c\gtrless0\gtrless\grave{a}x^2+bx^2+c\\ \acute{a}>0>\grave{ 阅读全文

posted @ 2017-04-15 20:27 江小修阅读(425) 评论(0) 推荐(0) 编辑

线性回归

摘要：机器学习的典型的学习过程是：首先给出一个输入数据，学习算法就是要学得一个估计的函数，这个函数能对未知数据给出一个估计，这也称为构建一个模型。线性回归是假设特征和结果满足线性关系。估计函数：$h\left(x\right)=h_\theta\left(x\right)=\theta_0+\thet 阅读全文

posted @ 2017-04-15 16:12 江小修阅读(113) 评论(0) 推荐(0) 编辑

公告