NLP-特征选择
摘要:文本分类之特征选择1 研究背景 对于高纬度的分类问题,我们在分类之前一般会进行特征降维,特征降维的技术一般会有特征提取和特征选择。而对于文本分类问题,我们一般使用特征选择方法。特征提取:PCA、线性判别分析特征选择:文档频数、信息增益、期望交叉熵、互信息、文本证据权、卡方等特征选择的目的一般是:避...
阅读全文
posted @
2015-03-27 15:34
robert_ai
阅读(6484)
推荐(0) 编辑
ML 逻辑回归 Logistic Regression
摘要:逻辑回归Logistic Regression 1 分类 Classification 首先我们来看看使用线性回归来解决分类会出现的问题。下图中,我们加入了一个训练集,产生的新的假设函数使得我们进行分类出现了错误;而且线性回归计算的结果往往会远小于0或者远大于1,这对于0,1分类变得很奇怪。可见线...
阅读全文
posted @
2015-03-10 10:42
robert_ai
阅读(1658)
推荐(0) 编辑