困惑度的计算

困惑度公式：

困惑度的定义如上。
具体里面这个条件概率概率怎么计算呢？
假设我们的生成模型生成了一个 shape为(N，D)的序列。表示N个字，序列长度，序列中，每个token的概率分布维度为D，也就是字典中共有D个字。
由于我们是自回归模型，基于前k个字预测第K+1个字。所以这个N*D序列中的每一行本身就表示一个条件概率。因此，假设从这个概率分布中采样了N个字出来。
每个字的条件概率就是该字在矩阵中对应概率。

posted @ 2024-10-16 10:02 continu~ 阅读(44) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 一些AI数学基础

· 一个极限小问题

· ：）语言模型的评价-PPL迷惑度-从语言模型说起-|

· 概统——条件概率计算公式的推导（非Venn图）

· 笔记——概率期望DP·Part1

阅读排行：
· 地球OL攻略 —— 某应届生求职总结
· 周边上新：园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源！
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】

公告

昵称： continu~
园龄： 9个月
粉丝： 1
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜