STCKA
核心:
针对因为没有足够上下文的导致语义模糊的短文本进行分类
具体思路:
利用外部资源加强短文本的语义 通过两个attention分别评估权重 综合进行文本分类
模型整体架构:
整体架构如下:
知识检索
通过实体链接技术将短文本中的实体链接到图谱中,然后获取到该实体在图谱中的概念化的知识(通过KBs)。如: 论“中国历史剧的创作”中的实体包括“中国”和“历史剧”; 从图谱中找出“中国”,然后获取它的概念得到“国家”、“国”、“古国”、“文明古国”; 从图谱中找出“历史剧”,然后获取它的概念得到“历史”;
短文本编码
知识编码
为了防止attention的结果带来的网络退化问题,引入了残差神经网络结构。
输出部分
作者将两个编码部分的输出进行拼接,然后接一层全连接的层,将输出维度变换成我们的类别数,然后进行类别的预测,实现文本分类。
模型试验结果对比
Attention机制
结合了C-ST Attention(Concept towards Short Text)和C-CS(Concept towards Short Text)两种attention机制。
其中C-ST Attention是为了减少歧异词对模型的影响
而C-CS Attention 是判断概念重要性的自注意力机制

最后将两个注意力机制合并并引入了调节因子γ,取值范围为[0,1],用于调节两个attention之间的权重
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通