Fork me on GitHub

大模型和人一样需要 提高对 编程语言认知


今天在ChatGLM2-6B 的仓库里看到了这么一个issue: https://github.com/THUDM/ChatGLM2-6B/issues/122

image

这位兄弟说的挺好,其中有点小错误:三星Tizen架构 其实不是架构,是属于arm架构 ,Tizen是 三星的一个操作系统。由此我想到了ChatGLM2 是国人开源的LLM ,因此我去国内的几个大模型应用上面去问问这个问题:

1、科大讯飞的星火大模型:

image

image

看到星火大模型对c# 的认知也是停留在10几年前 ,这和国人对c# 的理解比较接近。 接下来我们去看下百度的文心一言:

image

文心一言也是一样的,这个认知也是停留在10几年前了, 这么看来大模型的认知 受到他的训练者的影响是很大的。 通过这几个国内的大模型可以知道他们的训练数据很差,带满了偏见,对C# 语言的认知还停留在10几年前,下面我们把这个问题问下ChatGPT吧 :

首先问下 GPT-3.5的模型,回答明显比国内这些大模型公正,认知上比较符合事实:

image

image

我们再来用 GPT-4 问一下,回答是正确的:


image

image

从国内外大模型对这么一个简单问题的回答答案来看,国内的这些大模型和 GPT 相比,智商还差得远。 大模型和人一样对这个世界的认知也是有偏差的,喂给她什么知识,他就记住了什么。 马上就要发布.NET 8 的第一个RC版本了, .NET 8带来一个很大特性是NativeAOT, 以后用C# 写的程序,用NativeAOT编译,可以告诉别人说我这程序是C++ 写的, 可以给用Java 通过JNI 来调用。

这个蓝色星球上的C# 语言的采用还是在稳步上升的,Tiobe 的8月份排行榜里,前五名里面只有c# 是在稳步上升,其他的都在下降:

image

今年以ChatGPT为代表的AIGC,微软抓住了, 微软在采用GPT 改造传统应用的过程中开源了一个LLM 开发SDK semantic kernel(简称sk),他的主要语言就是c# , 现在已经支持Java,Python。 SK 经过微软的实践总结,然后在今年的3月份开源,现在已经有star 12k,经过半年时间的社区开源协作,接口逐渐稳定。随着大量企业的GPT 改造浪潮。c# /.NET 会继续上升。

在国内,虽然没有国外那样的上升势头,在国内的很多领域还是非常坚挺的,也有变好的趋势。现在.NET的开源生态已经成熟,剩下就是大家的工程思维和管理思维需要提升,特别是AI领域的算法门槛已经大大的降低,更多的是靠软件工程来补齐,就拿当前在LLM 应用开发领域的两大开发框架 SK 和 langchain来对比,langchain10 几个漏洞,sk没有漏洞。 langchain 是原来搞机器学习算法的人搞的,很多学校里搞算法的博士生算法是厉害,代码基本上不堪入目,使用Python这种胶水代码基本上很难在大并发的工程实践上有什么比用C# 或者Java 好的。现在基于transformer的GPT 模型的落地已经是工程的事情而不仅仅是算法的事情了。

posted @ 2023-09-02 21:46  张善友  阅读(791)  评论(3编辑  收藏  举报