175 Golve词向量

Golve算法预处理出二维矩阵X,其中Xij表示单词i出现在单词j的上下文的次数。在某些上下文定义(比如定义ij的上下文指ij的十个临近单词中)下,有Xij=Xji.目标函数如下
image
其中f是权重向量,若Xij=0,则f(Xij)=0,这个样子是为了避免计算log0
视频还说θe是对称的,没听懂,在视频5:55处

最后还要提一点,我们举例的嵌入矩阵一直是下面这个
image
每一行似乎可以人为解释(性别,年龄等),但实际上无论我们用什么办法跑出来的嵌入矩阵的每一行都可能是无法解释的。一个很简单的理解方法:假设学出来的嵌入矩阵的每一行是可解释的,若我们有一个可逆矩阵A,则有θTe=(Aθ)T(ATe),这就是将学出来的嵌入矩阵的坐标轴进行了变换,很显然就可以变换到一个我们根本不知道长成什么样子的时空,所以我们是无法保证我们学习出来的嵌入矩阵是可以解释的

posted @   最爱丁珰  阅读(2)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
历史上的今天:
2024-02-16 序列统计
2024-02-16 糖果盒
2024-02-16 何老板请客4
2024-02-16 何老板请客2
2024-02-16 何老板请客1
2024-02-16 体操队形1
2024-02-16 体操队形
点击右上角即可分享
微信分享提示