《中国人工智能系列白皮书——深度学习》【中国人工智能协会】（2023年9月）

以 ”软件——速度——机器学习——深度学习“的视角

人工智能的历史与现状

人工智能概念的提出：1956年达特茅斯会议

人工智能黄金时代：1960-1980，感知机，贝叶斯网络等模型提出。

人工智能的冬天：1980年之后。原因是模型、算力、数据都不足。

1997年，”深蓝“超级计算机打败了职业象棋棋手”卡斯帕罗夫“，因为三点：①上万把前人对局数据的存储②搜索算法③硬件上的并行计算

21世纪前，leNet在手写数字识别的方向上做到对邮票数字识别准确率低于1%

复兴期：21世纪初-2010。以SVM为代表的机器学习，神经网络的提出【上面这些，因为能使用非枚举的方法实现对NP问题的解决，所以可以叫做机器学习。因为网络深度还不够深，问题解决能力远远比不上下面这些，所以都只能叫机器学习】

爆发期：2010年之后。深度神经网络的提出，以后的模型都是很有深度，所以叫深度学习。AlexNet,GoogleNet,VGG,GesNet，lstm，GAN,VAE,AlphaGo,transformer,ChatGPT,Unet,SAM的提出。

深度学习模型

深度学习模型的特点是模型深度比较深，所以需要较多的数据来更新模型的权重，还有更高的算力来支持训练和使用。

然后是介绍了一些深度学习模型的结构。

深度学习模型压缩

chatGPT3有1750亿参数，使得一般电脑没有能力、没有足够算力跑得动这个模型，也可能存储不了这十几G的模型。就需要考虑如何压缩模型。

压缩方式有三种：剪枝、知识蒸馏、量化

剪枝：删除冗余节点

知识蒸馏：用大模型（教师网络）训练小网络（学生网络），缺点是只能用于分类任务

量化：将模型节点精度从32位转为16位甚至8位

人工智能大模型

深度学习大模型（GPT3）定义：拥有千万到亿级（1750万）参数，基于超大规模（500GB数据）数据集，在高算力集群上（335个GPU年）训练，在大规模未标记数据上训练得到特征表示，再在有标签的数据上进行微调使之适配特定的任务。

例子：chatGPT，悟道，神农

深度学习与图像描述生成及视觉定位（给图像生成文本）

数据爆炸时代，文本数据很好统计并分类。但是图像数据是非结构化的，需要找到一种方式来组织、存储、检索图像。也就是让计算机在语义上理解图像。

分为三步：文本特征提取，视觉特征提取，视觉与文本特征融合推理

介绍了一些最新（至2023.08）的模型

深度学习在编码中的应用

超高清视频、虚拟现实视频、全景视频等技术的出现，使得传统视频编码性能跟不上需求。需要深度神经网络来对视频进行编码，使得体积更小。

介绍了一些最新（至2023.08）的模型

---------------------------------接下来是AI for Science的交叉学科应用-------------------------------------------------------------------------

深度学习在天文学研究中的应用

目标检测（太阳黑子），时间预测（预测太阳耀斑发生时间），图像生成（电磁干扰下图像的重建使得图像变清晰）

雷达智能信息处理

图像处理（去除雷达生成图像噪声，增强微弱信号），目标检测（海上目标）

深度学习与智慧海洋相关应用

水下图像处理（去噪）

深度学习与医工结合相关应用

医学图像分类、检测、分割、增强、图像生成

深度学习在大数据处理中的应用

对天文大数据（天文望远镜采集到的大量观测数据）分类、处理

对医疗大数据（每天人们看病产生的结构化和非结构化文字、图像数据）疾病诊断

对金融大数据（银行、证券交易、保险）的分类、预测

深度学习在三维点云技术中的应用（3维空间点的集合）

点云压缩、点云压缩修复（补全）

posted @ 2024-04-08 18:54 zhuangzhongxu 阅读(40) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

2436eded1a677650