2021 年 1月 31 日随笔档案 - 早起的小虫子

2021年1月31日

摘要：让我们试着去理解最广泛使用的损失函数-交叉熵。交叉熵（也称为对数损失）是分类问题中最常用的损失函数之一。但是，由于当今庞大的库和框架的存在以及它们的易用性，我们中的大多数人常常在不了解熵的核心概念的情况下着手解决问题。所以，在这篇文章中，让我们看看熵背后的基本概念，把它与交叉熵和KL散度联系起来。阅读全文

posted @ 2021-01-31 23:05 早起的小虫子阅读(200) 评论(0) 推荐(0) 编辑

最大熵模型原理小结

摘要：最大熵模型(maximum entropy model， MaxEnt)也是很典型的分类算法了，它和逻辑回归类似，都是属于对数线性分类模型。在损失函数优化的过程中，使用了和支持向量机类似的凸优化技术。而对熵的使用，让我们想起了决策树算法中的ID3和C4.5算法。理解了最大熵模型，对逻辑回归，支持向量阅读全文

posted @ 2021-01-31 22:02 早起的小虫子阅读(284) 评论(0) 推荐(0) 编辑

机器学习中数据缺失的处理及建模方法

摘要：在机器学习中建模的时候，往往面临两个困难，一是选择哪个模型，二是怎样处理数据。处于数据包括数据获取、数据清洗和数据分析。其实对于不同的场景和不同的数据，选择的模型也是不一样的，本文简单聊一聊在数据缺失的时候该怎样选择合适的模型。一、缺失数据处理及建模方法数据缺失时，处理数据的方式有如下三种： ( 阅读全文

posted @ 2021-01-31 10:02 早起的小虫子阅读(1733) 评论(0) 推荐(0) 编辑

早起的小虫子

路漫漫其修远兮，吾将上下而求索！

公告