摘要: 让我们试着去理解最广泛使用的损失函数-交叉熵。 交叉熵(也称为对数损失)是分类问题中最常用的损失函数之一。但是,由于当今庞大的库和框架的存在以及它们的易用性,我们中的大多数人常常在不了解熵的核心概念的情况下着手解决问题。所以,在这篇文章中,让我们看看熵背后的基本概念,把它与交叉熵和KL散度联系起来。 阅读全文
posted @ 2021-01-31 23:05 早起的小虫子 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 最大熵模型(maximum entropy model, MaxEnt)也是很典型的分类算法了,它和逻辑回归类似,都是属于对数线性分类模型。在损失函数优化的过程中,使用了和支持向量机类似的凸优化技术。而对熵的使用,让我们想起了决策树算法中的ID3和C4.5算法。理解了最大熵模型,对逻辑回归,支持向量 阅读全文
posted @ 2021-01-31 22:02 早起的小虫子 阅读(284) 评论(0) 推荐(0) 编辑
摘要: 在机器学习中建模的时候,往往面临两个困难,一是选择哪个模型,二是怎样处理数据。处于数据包括数据获取、数据清洗和数据分析。其实对于不同的场景和不同的数据,选择的模型也是不一样的,本文简单聊一聊在数据缺失的时候该怎样选择合适的模型。 一、缺失数据处理及建模方法 数据缺失时,处理数据的方式有如下三种: ( 阅读全文
posted @ 2021-01-31 10:02 早起的小虫子 阅读(1733) 评论(0) 推荐(0) 编辑