摘要: 摘要 我们提出了一种训练神经网络的方法,使用强化学习(RL)中的演员评论方法生成序列。当前的对数似然训练方法受到训练和测试模式之间差异的限制,因为模型必须以先前的猜测而不是地面真实标记为基础生成标记。我们通过引入一个经过训练来评估输出令牌价值的评论家网络来解决这个问题,给定了演员网络的策略。这导致训 阅读全文
posted @ 2019-05-06 16:38 笙玄羽 阅读(787) 评论(0) 推荐(0) 编辑
摘要: 随着人工智能的进步和技术变得越来越复杂,我们希望现有的概念能够接受这种变化 - 或者改变自己。同样,在自然语言的计算机辅助处理领域,自然语言处理的概念应该让位于自然语言理解,或者两个概念之间的关系更微妙,更复杂,而不只是技术的线性进展。在这篇文章中,我们将仔细研究NLP和NLU的概念以及它们在AI相 阅读全文
posted @ 2019-05-06 16:16 笙玄羽 阅读(275) 评论(0) 推荐(0) 编辑