/*--------------------CSS部分-------------------*/ /*--------------------JS部分-------------------*/

为什么大模型突然间火了

为什么大模型突然间火了

大模型是今年4月份chatgpt火了之后,公司开始意识到这个东西可能有点东西,为此组织预研。本身公司是安防科技公司,先是预研的cv领域的大模型。总体而言,视觉大模型在行业内落地目前都在预研中,没有语言类大模型给人带来那么强烈的震撼感。

在B站看到陆奇的演讲后,自己整理下大体思路,记录自己的收获。

一、社会变革

整张胶片分析的比较全面,从人类环境层面讲述了新一代的大模型能够将信息整合,进而实现分析和思考,指导人的行为。并描述了人工智能的大体发展历程,一开始的人工智能,主要对网络的信息进行整合,类似阿尔法狗的这样的。后来随着视频领域人工智能发展,在视觉场景进行落地,进而有了边缘计计算、元宇宙等概念,最后大模型的出现直接有可能实现真正的人工智能,即通用人工智能(具有分析推理的智能)。

二、社会影响

在整体的社会组织中有各种形式的工作形式和生活方式,技术上对社会的影响正如胶片所描述。目前城市中在数字化中,信息化建设基本完成,目前数字中模型在逐渐完善(即目前的人工智能场景应用)。大模型到来后,则是产生更进一步的影响,则是AI经济,可以全面替代脑力和体力劳动,也许真有可能达到三体的一些水平。

三、OpenAI

大模型一直在搞(大模型即参数在1B以上),只有OpenAI的GPT3.5模型具有推理和分析能力,就像神经细胞多了,突然从哺乳动物进化成人类了。此处必须给OpenAI公司点个赞,听说人家一上来本来就是搞技术,没想过挣钱的事。(有钱人真好)

当意识到大模型这么好用时,OpenAI开始推广其应用,在国外与其合作的公司立马春笋一样多了起来,在各个场景中进行应用。也会发现现在技术大佬常常跳出来,开始自己搞大模型,有算力和有数据(这俩你要还真有钱,还是一堆钱那样的),此外大模型的技术壁垒很高,不是你有了框架和代码就能训练一个好模型,这碗饭如果能吃起来,还挺香。

四、具备的能力

目前科技公司开始加足马力在搞大模型,构建自己的技术生态,无论是商汤、华为、百度、阿里等等。毕竟现在“群模乱舞”,谁能异军突起,也许引领下一个技术浪潮。针对我们研发人员,如果去搞,掌握的技术还是比较多,正如胶片所述,涉及的领域挺多,并不一定大家都在搞算法,研究算法,算法落地才是根本啊。

五、结论

大模型确实很牛,技术门槛有点高,如果想切入赛道,研发人员需要重新学习,毕竟不想现在的一些检测分类那么简单,喂上数据,修改配置文件,启动训练,模型基本够用。现在大部分公司还是在搞基于大模型的垂直应用,比如基于语言的大模型的知识搜索、简单问答、优化智能推荐等等,还有图像领域的通用视觉模型实现小样本的优化,这些技术点还是可以落地的。

在学习时,一定主要技术的生态,从理论到代码逻辑,从训练、推理、测试、落地等多方位考虑学习,这样自己能较快实现方向的切换,重点自己要找准一个技术路线,踏踏实实去训练优化落地等等。

posted @ 2023-07-28 11:07  bldong  阅读(595)  评论(0编辑  收藏  举报