现有的商用大模型具有的能力

我们现在一提到大模型,总感觉这玩意好像什么都能干,主打一个'生成'能力,但是有一说一,图像生成与大模型目前是两个不同的方向,只不过在现阶段两者都在大放异彩.今天主要说一说目前商用的大模型,也就是指闭源的大模型都具有哪些能力,我们首先了解了这些能力,也可以清楚大模型具体可以做哪些事情,那么后面遇到具体需求的时候,就能想到也可以使用大模型来做这个事情.

注意一点,不同参数量的模型所表现出来的能力是完全不一样的.以chatgpt为例,有人说chatgpt可以做的事情太多了,多到无法想象,显然这种认知是很狂热的,在业内人看来,chatgpt能做的事情是有限的,下面具体来说说

翻译

写作(文章、新闻、小说、诗歌等。用户只需要输入一些关键词或主题)

问答(问答所涉及领域非常广泛,几乎涉及了人类所有的领域,通过专业知识训练)

教育(数学)

写代码(属于问答系统)

 

写到这里,感觉梳理的不是很清楚,但是我们要注意一点,生成式的功能具有不可靠性,很多看似一本正经的回答,其实都是错误的,所以必须要自己判断或者尝试才知道,但是总的来说还是帮助很大,特别是问一些代码参数和一些包的用法.

后续再增加吧

--------------------------2023-05-09 14:58:55--------------------------------

以下是斯坦福羊驼大模型给出的能力图

 

posted @ 2023-05-09 10:53  海_纳百川  阅读(70)  评论(0编辑  收藏  举报
本站总访问量