智谱DevDay 嘉宾演讲的一点点思考

(1)AI的落地方向:【超级个体】+【智能流程】

【超级个体】就是说,让员工把AI在工作中用起来。不仅仅是提高效率,先让一个人尝到甜头,它才有可能研究这东西。你说服不了一个人研究AI,但你可以让它看看AI的威力。

但这只是一个一个单点,我们还需要把点连线,让整个流程自动化,也就是【智能流程】。可能一开始斌不能完全自动化,但达到50%自动化之后,即使还有一点点手动,你也会觉得神清气爽。

现阶段AI可能还不鲁棒,但通过微调,可控生成,向量匹配等技术,把不鲁棒的东西变鲁棒,正是我们工程师的本职。

(2)坚信AGI是未来方向

计算机科学的终极目标(并不是所有领域)就是AI,AI的目的就是解放劳动力,干掉简单低级劳动,实现全自动化。这个是毋庸置疑的。

AGI的速度可能比想象中要快,至少五年之前,没有人相信AGI这个东西

可能现在走的路并不是AGI,但一切技术都是过渡技术,不妨碍我们把它充分应用。就比如很多NLP小模型,可能看起来和LLM没多大关系,但它们产生了大量的不同领域的标注数据,这些数据可以成为LLM的指令微调数据集。

反正一切技术上的弯路都不是白费的,总会以你想不到的方式发挥作用。

(3)算力可能要到十年之后才能自给自足

个人认为目前应该尽可能利用一切能利用的设备。比如A卡天生支持OpenCL,显存又给的大。要敢于自己开发基础设施。

再有就是模型结构的魔改上要发力,多做实验,说不定啥时候就成功研发了复杂度更小的LLM。

在专用硬件(不只是FPGA)设计上也要看看能做什么。AI辅助芯片设计是个有前景的东西。

(4)高质量数据是关键

现在的模型架构趋于统一,大家魔改模型是为了计算量而不是任务表现,这是个可喜可贺的事情,大家有了统一的框架才方便比拼实力。

那么决定模型表现的关键因素就是数据了。平时要注意积累高质量数据,可能说不定啥时候就用上了。

(5)一定要有业务

LLM 代替了很多简单劳动,但它没有办法代替一个人对业务的理解。不懂业务就没办法搞出来能落地的,特定领域的模型。

不懂业务的技术公司很容易出局,这是上一轮AI创业公司的共同现象。道理很简单,没有业务就没有营收渠道,只能被迫和业务公司合作,大模型也不是什么保密技术,迟早就被业务公司学去。懂业务就可以不依赖任何其它公司直接从市场赚钱。甚至大模型可以帮你把一些杂事搞定,你就专注于【选哪个领域】和【执行步骤】就可以了。

posted @ 2024-01-17 00:55  绝不原创的飞龙  阅读(16)  评论(0编辑  收藏  举报