2017 年 8月 22 日随笔档案 - 郑哲

2017年8月22日

摘要：无监督学习聚类：对数据进行分类 1.K均值算法先选两个中心簇分类：根据离两个点的距离远近，把数据分成两类移动中心，移动到各类的中心：不断循环上面的步骤输入： 1.K-分类的个数。 2.训练集算法：如果在循环过程中一个类没有和他最近的点， 1.移除这个类，也就是减少一个类 2.随机产阅读全文

posted @ 2017-08-22 19:03 郑哲阅读(383) 评论(0) 推荐(0) 编辑

支持向量机的实现

摘要：使用SVM优化包（liblinear,libsvm)来求θ 我们要做得： 1.选择适当的C值 2.选择相应的核函数我们也可以不选择核函数（称为线性核函数）弊端：如果你有大量的特征变量如果 n 很大而训练集的样本数 m 很小那么你知道你有大量的特征变量 x 是一个 n+1 维向量 x 阅读全文

posted @ 2017-08-22 18:19 郑哲阅读(278) 评论(0) 推荐(0) 编辑

支持向量机核函数

摘要：当我们要去判断一个非线性的区域，我们会选择用非线性函数来拟合。问题是能不能选择别的特征变量或者有没有比这些高阶项更好的特征变量因为我们并不知道这些高阶项是不是我们真正需要的我们之前谈到计算机视觉的时候提到过这时的输入是一个有很多像素的图像我们看到如果用高阶项作为特征变量运阅读全文

posted @ 2017-08-22 13:01 郑哲阅读(916) 评论(0) 推荐(0) 编辑

支持向量基

摘要：强大的算法广泛的应用于工业界和学术界它被称为支持向量机(Support Vector Machine) 与逻辑回归和神经网络相比支持向量机或者简称SVM 在学习复杂的非线性方程时、提供了一种更为清晰更加强大的方式 Logistic回归的替代观点 J(θ)=-(yloghθ(x)+(1 阅读全文

posted @ 2017-08-22 12:13 郑哲阅读(254) 评论(0) 推荐(0) 编辑

倾斜类误差度量

摘要：癌症分类例子：训练逻辑回归模型hθ(x).(如果有癌症则为1，没有为0）我们在测试集中得到1%的错误率,看起来不错但是假如我们发现在测试集中只有0.5%的患者真正得了癌症因此在我们的筛选程序里只有0.5%的患者患了癌症只有0.5%的错误率，显然只考虑误差率不合适因为你可能会获阅读全文

posted @ 2017-08-22 09:58 郑哲阅读(566) 评论(0) 推荐(0) 编辑