随笔分类 - 机器学习实战
学习
摘要:1.利用Logistic regression 进行分类的主要思想 根据现有数据对分类边界线建立回归公式,即寻找最佳拟合参数集,然后进行分类。 2.利用梯度下降找出最佳拟合参数 3.代码实现 结果: the error rate of this test is:0.522388 the error
阅读全文
摘要:1.从文本中构建词向量 将每个文本用python分割成单词,构建成词向量,这里首先需要一个语料库,为了简化我们直接从所给文本中抽出所有出现的单词构成一个词库。 2.利用词向量计算概率p(x|y) When we attempt to classify a document, we multiply
阅读全文