Skip-Gram模型
Skip-gram基本思想
根据中心词来预测上下文。
Skip-gram计算方法
采用滑动窗口机制,窗口中心为中心词w,根据中心词w推断窗口内其他词,也就是上下文词c。
假设有单词序列:“鸡你太美”,窗口大小win为2,也就是取中心词左右两边的一个单词。
则根据中心词预测上下文的概率为:P(你|鸡) P(鸡|你)P(太|你) P(你|太)P(美|太) P(太|美)
计算目标就是使得这个概率连乘数值最大。
因为概率是小于0的数,越乘越接近于0,因此取个log。
公式可以改写为
表示对于每个中心词,计算其上下文的概率。
关于P(c|w;θ)的计算,必须满足两个条件:
-
- P(c|w;θ)在0和1范围内
- 对于所有的上下文,P(c|w;θ)的总和为1。
所以使用softmax函数:
uc表示上下文单词的向量表示
vw表示中心词的向量表示
U表示所有可用的上下文集合。
公式的意思也就是:给定中心词和给定的上下文 占 该中心词与所有上下文组合 中的比例,也就是特定中心词和特定上下文出现的概率。
将其代入原式得:
Skip-gram优化目标
本文来自博客园,作者:Laplace蒜子,转载请注明原文链接:https://www.cnblogs.com/RedNoseBo/p/17271738.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律