5分钟NLP:Python文本生成的Beam Search解码
贪婪搜索是在每个时间步中选择概率最高的单词,也是我们最常用的一种方法,Beam Search不取每个标记本身的绝对概率,而是考虑每个标记的所有可能扩展。然后根据其对数概率选择最合适的标记序列。
例如令牌的概率如下所示:
例如,Pancakes + looks时间段1的概率等效于:
Pancakes looks so = log(0.2) + log(0.7)= -1.9
Pancakes looks fluffy = log(0.2) + log(0.3)= -2.8
所以我们需要定义一个函数来完成整句的概率计算:
完整文章:
https://avoid.overfit.cn/post/ba2eb47bb35d43d99fb58333d37f13cb