人工智能与智能计算的发展
我国应走出适合自己的人工智能赋能实体经济的高质量发展道路—孙凝晖
1. 计算技术的发展历程
机械计算时代:算盘的出现;
电子计算时代:电子器件与电子计算机的出现;
网络计算时代:互联网的出现;
智能计算时代:AI 的出现;
现代计算机的科学基础
- 数学:布尔数学,描述程序和硬件的底层逻辑;
- 计算模型:图灵机,通用的计算模型;
- 结构:冯诺依曼体系结构,采用二进制,程序存储执行,计算机由运算器,存储器,输入设备和输出设备五个基本单元组成;
- 器件:晶体管,构成逻辑与存储电路的基本组件;
2. 智能计算的发展历程
2.1 智能计算发展的起点-通用计算装置
1946
1946 年出现的通用计算装置,用于计算自动化问题。1956 年,AI 的概念诞生。此后所有人工智能技术的发展都是建立在新一代计算设备与更强的计算能力之上。
2.2 智能计算发展的第二阶段-逻辑推理专家系统
1990
1990 年的逻辑推理专家系统。符号智能学派科学家以逻辑和推理能力自动化为主要目标,提出了能将知识符号进行逻辑推理的专家系统。
人的先验知识以符号的形式进入计算机,使得计算机能在特定领域辅助人类进行判断和决策。但是专家系统严重依赖于手工生成的知识库或规则库。
符号计算系统的局限性
- 符号计算系统对于高维问题存在计算复杂度爆炸的现象,因此只能解决线性增长问题,而对于高维复杂空间问题无法求解;
- 符号计算系统基于知识规则建立,无法枚举所有的常时,应用受限;
2.3 智能计算发展的第三阶段-深度学习计算系统
2014
中科院计算技术研究所 2013 年提出了国际首个深度学习处理架构。2014 年左右,智能学派以学习能力自动化为目标,产生了深度学习等 AI 算法。
2.4 智能计算发展的第四阶段-大模型计算系统
2020
- 小模型+判别式 >> 大模型+生成式(AIGC);
- 传统的人脸识别,目标检测,文本分类 >> 文本生成,图像生成,语音生成等;
- 大模型在对话系统领域的一个典型应用:GPT-3 采用给定一个输入,预测下一个 token 来训练模型,最后在大模型的基础上进行微调与人类价值观对齐;
- 大模型具有参数大,训练数据大,算力需求大等特点;
大模型系统带来的技术变革
- Scaling Law
当 AI 模型参数达到某个阈值后,模型的能力快速提升。模型的性能与模型参数规模、数据集大小、算力成对数线性关系。目前来说,通过增加参数规模可以显著提高模型的智能性;
- 算力需求急剧增长
模型训练过程中对算力的急剧需求,使得算力相关的企业高速发展,NVIDIA 市值不断增长。
- 劳动市场冲击
根据《AI大模型对我国劳动力市场潜在影响研究》内容,财会、销售、文书等职业受 AI 冲击的程度位于前列,而需要与人打交道并提供服务的体力劳动型工作,如人力资源、行政、后勤等反而相对更安全。
2.5 大模型的发展方向
多模态
同一个模型,接受多个不同的 token 序列,采用与 LLM 模型相同的方法学习。
视频生成大模型
分辨率、画面真实度、时序一致性。OpenAI 于 2024 年 2 月 15 日发布生成视频模型 SORA,具备世界模型的基本特征—即人类观察世界并进一步预测世界的能力。世界模型是建立在理解世界的基本物理常识之上,然后预测接下来发生的事件。
具身智能
具有人造身体并支持与物理世界的交互。借助多模态大模型处理输入的数据,大模型的输出结果作为智能体的运行指令。可以说,具身智能的机器人包括:以神经网络为代表的连接主义,以知识工程为代表的符号主义,与控制论相关的行为主义。
AI4R
AI for Research
使用 AI 进行科学发现和技术说明,提升人类的科学研究效率,实现从推断(inference)到推理(reasoning)的跃升。
AI 在科学研究的一些应用:
- 预测蛋白质结构;
- 高效合成新药;
- 设计高性能的芯片;
- 得到优化的结构;
AGI
Artificial General Intelligence
AI 大模型当前主要是通过数据驱动等研究宏观世界的方法进行发展。AI 的变革性发展,还需要到神经系统的微观世界中寻找答案。
3. 人工智能安全风险
加强安全监管技术与可信的大模型;
安全风险
- 虚假信息泛滥,数字分身;
- 伪造视频新闻,引发舆论事件,导致新闻媒体行业的社会信任倒退;
- 用于诈骗,AI 换脸变声;
- 生成不雅图片;
可信度
- AI 产生事实性错误;
- 以西方价值观为主,输出政治偏见和错误言论;
- 易被诱输出有害内容;
- 数据安全问题,大模型成为重要敏感数据的诱捕器;
4. 发展困境与道路选择
4.1 发展困境
困境一
美国在 AI 核心能力上处于领先地位,包括:
- AI 高端人才数量;
- AI 基础算法创新;
- 生成大模型能力;
- 大模型训练数据;
- 大模型训练算力;
困境二
训练的高端算力芯片被禁售(A100,H00,B200等),国内核心算力芯片落后国际 2-3 代;
困境三
国内 AI 生态发展不足,而 NVIDIA 的 CUDA(Compute Unified Device Architecture,通用计算设备架构)生态完备,具有 550 个 SDk(Software Development Kit,软件开发工具包)。
国内企业间无法形成一个深度适配的强竞争力技术体系,难以形成合力。
困境四
AI 从互联网行业向非互联网行业迁移的难度较大,单次使用成本较高,且 AI 人才数量明显不足。
4.2 道路选择
选择一—智能计算体系的发展道路
智能计算体系发展的三条道路:
- 追赶美国主导 AI 技术的兼容体系;
- 构建专用的封闭体系,形成完整可控的技术体系与生态;
- 全球共建开源生态体系;
选择二—智能计算产业的中国方案
智能计算的一个核心特征就是用算法在算力池中加工海量数据,得到智能模型,再嵌入到信息和物理世界的各个过程中,网络上传输的智能流是算力对数据进行深度加工与精炼后的模型化抽象。
对于市场中绝大多数的中小微企业,需要的低门槛,低价格的智能服务。因此中国智能产业率先实现新型基础设施(数据,算法,算力)建设工作,类比与二十世纪初美国的信息高速公路计划中信息基础设施的建设。
- 数据:大力建设国家数据枢纽与数据流通基础设施;
- 算法:以通用大模型为基座,构建大模型研发与应用的基础设施;
- 算力:作为算力基础设施化建设的全国一体化算力网,算力基础设施的中国方案需要具备“两低一高”,即供给侧降低算力的总成本,消费侧降低算力的使用门槛,服务效率方面实现低熵高通量;
选择三—人工智能赋能的实体经济
在”AI+“成效中,美国倾向于回报率高的虚拟经济,轻视投资成本高且经济回报率低的实体经济。而中国更倾向于实体经济与虚拟经济同步发展,更加重视发展实体经济。
中国的优势在实体经济,制造业全球产业门类最齐全,体系最完整,特点是场景多、私有数据多。在"AI+"赋能相关产业中,其成功的关键在于能否让一个行业或一个产品的成本大幅下降,从而将用户数与产业规模扩大数倍。