31日智源大会小记:座谈会
思路速度有限,只能记一些关键词
一、 前瞻
1. NLP的4个边界:数据,符号,?,因果
2. 目前的NLP只能学习表面的关系,没有学习到因果关系,从数据学习因果关系是一个发展方向
3. 训练需要大量数据,现在的问题是没有标注好的数据,利用小数据、无监督的方法是一个发展方向
4. 期待不需要大量算力的方法,因为没有大量的计算资源不能做预训练任务,这限制NLP的发展
5. 跨模态是一个方向
6. 只靠大数据不够。人类的思维是先理解再推理,概念化的是离散的,理解到推理某种意义上就是连续到离散
7. 神经符号推理机器。常识:多模态
二、 产业
1. 多轮的人机对话,智能客服
2. 阅读理解,应用到知识密集型行业,如金融(贷款)、法律、教育
3. 语音,限定在一个小范围内
4. 统一的NLP的解决方案
三、 行业
1. 对话技术:闲聊,面向任务的,任务多样
2. 多模态的生成,有视频生成文字描述
3. 传媒行业
4. 通用的可理解的对话
5. 对话系统的规模化,通用对话平台
6. 对话:闲聊的一致性,评测标准
7. 人机协同,应用到教育、司法等
(行业这方面,总结来说,对话是十分被看重的)