//目录

语言大模型

大语言模型:

大所指代的包括三点

  1. 参数量大,处理自然语言的问题十分繁琐,大量的参数可以满足模型所需要的复杂性。
  2. 数据量大,大语言模型的训练需要大量的数据来保证其输出内容的准确性,泛化性。
  3. 复杂性大,处理语言问题需要较强的复杂性。

模型的作用是处理,分析和生成数据。

  1. 模型通过调用处理数据相关函数将导入模型的数据处理为数字数据
  2. 模型通过调用分析数据相关函数

计算机要想处理相关数据,必须将数据加工为计算机能够读懂的数据,此处一般指各种数字类数据,而我们要将研究的问题转变为数字相关的问题。

大:

模型的大,能够满足模型解决复杂问题的需求。

我们知道,当你为别人解答问题时,如果是一个学科类问题,比如一道数学题,物理题,化学题,他可能存在标准答案,但是我们往往要面临的确实语文题,他没有标准答案,又或者它有一个随着提问环境随之改变的标准答案,在解决这类问题时,需要经过复杂的思考,因此,为了让我们的模型具备复杂思考的能力,我们需要有较大量的复杂处理,大量的参数可以从结果的获取来说,它可以演示我们对同一个问题因种种因素而产生的不同的思考。

其次,我们知道,随着年龄的增长,随着我们阅历的丰富,我们解决实际复杂问题的能力也会提高,大模型虽然无法去亲身经历这些事件,但是通过我们相关数据的导入,让大模型从中学习,来提高解决相应问题的能力,随着导入导入数据量的增加,大模型的泛用性会提高()

比如当你生气的时候,在某些情况下,你通过自我调节就可以很好的恢复状态,但是在某些情况下,你需要合理发泄自己的怒火,除此之外,还有许多做法。决定选择以上哪种做法的因素,比如生气的原因,场合,生气的对象……

模型:

如何让计算机能够听懂人类的语言?难度在哪里?

从人类角度谈起:

假设你的对面有一个人,当他流利地说出一句话时,如:我喜欢你妈做的蛋糕。你能比较轻松的理解。

现在你的对面是一个结巴,当他吞吞吐吐地说出:我,喜,欢,你,妈,做,的,蛋,糕。时,你发现,只有当句子比较完整时,你才能准确知道它所表达的意思。

因此,模型在获取对话内容的时候,也是一句话一句话导入的,而不是一个字一个字导入。

从模型角度讲:

模型并不认识文字,也不知道文字与文字直接的联系,以及人们如何通过文字传递信息,模型又该如何通过文字将信息传递出去。因为计算机对于数字的应用要高于文字的应用,因此,我们通常采取将文字信息转化为数字信息,将两个人的沟通转化为数字问题。

posted @ 2024-08-07 23:15  兔兔求放过鸭  阅读(44)  评论(0编辑  收藏  举报