[NLP] 李宏毅《深度学习与人类语言处理》概述
一、什么是自然语言
自然语言:人类沟通所使用的语言叫自然语言
人工语言:人工发明的语言,如Python、Java等计算机语言叫人工语言
这里的自然语言处理:分为文本处理和语音处理两个部分
二、自然语言处理六大模型
1.语音识别
即输入语音,输出内容文本。
2.语音合成
即输出内容文本,输出对应的语音。
3.语音转换
语音分离(Speech Separation):即将一段输入语音分离为多段语音。例如多个人一起说话的语音,可以将其内容分离开。
声音转换(Voice Conversion):将语音转换为另外一个风格的语音(另一个人说话),类似柯南的变声器。
4.语音分类
语者辨认(Speaker Recognition):判断说话的人是谁。
关键字检测(Keyword Spotting):检测语音句子中是否出现关键字(用于语音助理的唤醒词,要求模型小,省电)。
5.文本处理
翻译(Translation):将一种语言翻译成另一种语言。
摘要(Summarizetion):提取一段长文本的摘要内容。
聊天机器人(Chat-bot):提供自动聊天功能。
问答机器人(Question Answering):自动客服等。
语法剖析(Syntactic Parsing):分析一段文字的语法。
6.文本分类
保持学习,否则迟早要被淘汰*(^ 。 ^ )***