摘要:
只有正样本的分类问题(Learning from Positive and Unlabeled examples)对于一个分类问题,有时候训练样本只有正样本,没有负样本。比如,文本分类中,假设我们有一些标定好的训练样本,有n个类,我们用这些训练样本去训练一个分类器,用于把新的文本分... 阅读全文
摘要:
Ubuntu配置VPN上网Ubuntu中的网络管理机制Ubuntu中有两种网络管理方案:文本配置工具以及图像化的管理工具NetworkManager.这两套网络管理工具是独立的,为了方便我只使用图形化的管理工具.这样,需要把/etc/network/interfaces文件中的其他... 阅读全文
摘要:
子空间算法问题描述:设X1,X2,...,Xp为训练样本,每个Xi为M维矢量,要求一个N×M的矩阵A,使得: YN×1=AN×MXM×1 AN×M=⎡⎣⎢⎢⎢⎢a1a2...aN⎤⎦⎥⎥⎥⎥ 当N≪M时,这是一种降维算法。这里主要介绍两种降维算法:PCA与LDA。PCA是无监督的降... 阅读全文
摘要:
一、集成学习(Ensemble Learning)集成学习是指通过训练多个分类器,然后将这些分类器组合起来,来获得比单个分类器更优的性能(比最好的那个分类器还要好)。如果每个分类器都是同种类型的(比如都是决策树或者都是SVM等等),那么这些单个的分类器我们称为基学习器;如果集成中包... 阅读全文