怎么衡量废话有多废

参考这篇文章:

https://mp.weixin.qq.com/s?__biz=MzI1OTYwNDE2Mg==&mid=2247483753&idx=1&sn=acec759cf688e21660b61e791986bfac&chksm=ea772ac4dd00a3d239995c8e6b9e83159e1ddd35781ec2109e1e0b6678f088001d988ca5756f&token=47119943&lang=zh_CN#rd

 

 

我们可以定义一个概率分布的不确定程度了,它可以定义成所有可能发生事件的不确定程度的期望:

 

这个公式里,x是事件,U是所有可能的事件,P(x)是事件x发生的概率。

 

现在你知道怎么去量化一个消息的信息量了吗?

 

刚刚介绍的“不确定程度”这个概念就是大名鼎鼎的信息熵entropy,是信息理论里面最最基础的一个概念。这个概念和它的延伸被用到了很多地方:

  1. 机器学习领域用到了,用来评价一个算法效果好不好

  2. 计算机存储用到了,用来研究怎么存数据用到的存储空间最小(信息压缩)

  3. 通信传输用到了,怎么传输信号才能保证就算丢失了部分信号也还能复原信息

  4. 物理学表示气体的有序性用到了(其实是物理先有类似概念的)

  5. ...

 

当我们这么“扎实地”去定义一个概念的时候,就会发现,它能被用到很多很多地方作为基础。

 

posted @   blcblc  阅读(74)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
历史上的今天:
2019-03-07 迁移tf1.0.1程序到tf1.12.0的过程
2019-03-07 机器学习平台使用第二块GPU的方法
2018-03-07 【tensorflow】最近一段时间好好学学这个-google的视频教程
2018-03-07 pip安装离线包的经验
2018-03-07 【DNN】非常好的一篇文章,讲了google最新的两个模型,wide-deep,deep-cross - 还有这个人的系列博客
2018-03-07 检索模型复习 - BM25,BIM, 向量空间模型,TFIDF
2017-03-07 str2int的代码(复习)
点击右上角即可分享
微信分享提示