摘要: 不平衡程度相同(即正负样本比例类似)的两个问题,解决的难易程度也可能不同,因为问题难易程度还取决于我们所拥有数据有多大。比如在预测微博互动数的问题中,虽然数据不平衡,但每个档位的数据量都很大——最少的类别也有几万个样本,这样的问题通常比较容易解决;而在癌症诊断的场景中,因为患癌症的人本来就很少,所以 阅读全文
posted @ 2019-03-21 17:22 墨眉长相思 阅读(1553) 评论(0) 推荐(0) 编辑
摘要: 最大熵模型,以及和逻辑回归模型之间的联系 阅读全文
posted @ 2019-03-21 09:30 墨眉长相思 阅读(658) 评论(0) 推荐(0) 编辑
摘要: 逻辑回归的极大似然,损失函数的求解,以及为何逻辑回归的判别式代表概率 阅读全文
posted @ 2019-03-21 09:11 墨眉长相思 阅读(225) 评论(0) 推荐(0) 编辑