《中国人工智能系列白皮书——深度学习》【中国人工智能协会】(2023年9月)

以 ”软件——速度——机器学习——深度学习“的视角

人工智能的历史与现状

人工智能概念的提出:1956年达特茅斯会议

人工智能黄金时代:1960-1980,感知机,贝叶斯网络等模型提出。

人工智能的冬天:1980年之后。原因是模型、算力、数据都不足。

1997年,”深蓝“超级计算机打败了职业象棋棋手”卡斯帕罗夫“,因为三点:①上万把前人对局数据的存储②搜索算法③硬件上的并行计算

21世纪前,leNet在手写数字识别的方向上做到对邮票数字识别准确率低于1%

复兴期:21世纪初-2010。以SVM为代表的机器学习,神经网络的提出【上面这些,因为能使用非枚举的方法实现对NP问题的解决,所以可以叫做机器学习。因为网络深度还不够深,问题解决能力远远比不上下面这些,所以都只能叫机器学习】

爆发期:2010年之后。深度神经网络的提出,以后的模型都是很有深度,所以叫深度学习。AlexNet,GoogleNet,VGG,GesNet,lstm,GAN,VAE,AlphaGo,transformer,ChatGPT,Unet,SAM的提出。

深度学习模型

深度学习模型的特点是模型深度比较深,所以需要较多的数据来更新模型的权重,还有更高的算力来支持训练和使用。

然后是介绍了一些深度学习模型的结构。

深度学习模型压缩

chatGPT3有1750亿参数,使得一般电脑没有能力、没有足够算力跑得动这个模型,也可能存储不了这十几G的模型。就需要考虑如何压缩模型。

压缩方式有三种:剪枝、知识蒸馏、量化

剪枝:删除冗余节点

知识蒸馏:用大模型(教师网络)训练小网络(学生网络),缺点是只能用于分类任务

量化:将模型节点精度从32位转为16位甚至8位

人工智能大模型

深度学习大模型(GPT3)定义:拥有千万到亿级(1750万)参数,基于超大规模(500GB数据)数据集,在高算力集群上(335个GPU年)训练,在大规模未标记数据上训练得到特征表示,再在有标签的数据上进行微调使之适配特定的任务。

例子:chatGPT,悟道,神农

深度学习与图像描述生成及视觉定位(给图像生成文本)

数据爆炸时代,文本数据很好统计并分类。但是图像数据是非结构化的,需要找到一种方式来组织、存储、检索图像。也就是让计算机在语义上理解图像。

分为三步:文本特征提取,视觉特征提取,视觉与文本特征融合推理

介绍了一些最新(至2023.08)的模型

深度学习在编码中的应用

超高清视频、虚拟现实视频、全景视频等技术的出现,使得传统视频编码性能跟不上需求。需要深度神经网络来对视频进行编码,使得体积更小。

介绍了一些最新(至2023.08)的模型

---------------------------------接下来是AI for Science的交叉学科应用-------------------------------------------------------------------------

深度学习在天文学研究中的应用

目标检测(太阳黑子),时间预测(预测太阳耀斑发生时间),图像生成(电磁干扰下图像的重建使得图像变清晰)

雷达智能信息处理

图像处理(去除雷达生成图像噪声,增强微弱信号),目标检测(海上目标)

深度学习与智慧海洋相关应用

水下图像处理(去噪)

深度学习与医工结合相关应用

医学图像分类、检测、分割、增强、图像生成

深度学习在大数据处理中的应用

对天文大数据(天文望远镜采集到的大量观测数据)分类、处理

对医疗大数据(每天人们看病产生的结构化和非结构化文字、图像数据)疾病诊断

对金融大数据(银行、证券交易、保险)的分类、预测

深度学习在三维点云技术中的应用(3维空间点的集合)

点云压缩、点云压缩修复(补全)

posted @ 2024-04-08 18:54  zhuangzhongxu  阅读(40)  评论(0编辑  收藏  举报