ES: 机器学习、专家系统、控制系统的数学映射
一、基本定义
1.机器学习维基定义:机器学习有下面几种定义: “机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。 “机器学习是对能通过经验自动改进的计算机算法的研究”。 “机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。” 一种经常引用的英文定义是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
2.专家系统维基定义:可以看作是一类具有专门知识和经验的计算机智能程序系统,一般采用人工智能中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。一般来说,专家系统=知识库+推理机。
3.控制系统还没有维基定义:自动控制系统是在无人直接参与下可使生产过程或其他过程按期望规律或预定程序进行的控制系统。自动控制系统是实现自动化的主要手段。
4.语义维基定义:语义学(英语:Semantics,法语:La sémantique),也作“语意学”,是一个涉及到语言学、逻辑学、计算机科学、自然语言处理、认知科学、心理学等诸多领域的一个术语。虽然各个学科之间对语义学的研究有一定的共同性,但是具体的研究方法和内容大相径庭。语义学的研究对象是自然语言的意义,这里的自然语言可以是词汇,句子,篇章等等不同级别的语言单位。但是各个领域里对语言的意义的研究目的不同:
- 语言学的语义学研究目的在于找出语义表达的规律性、内在解释、不同语言在语义表达方面的个性以及共性;
- 逻辑学的语义学是对一个逻辑系统的解释,着眼点在于真值条件,不直接涉及自然语言;
- 与计算机科学相关的语义学研究在于机器对自然语言的理解;
- 认知科学对语义学的研究在于人脑对语言单位的意义的存储及理解的模式。
5.语法维基定义:语言学中语法(英语:Grammar)是指任意自然语言中控制子句、词组以及单词等结构的规则,这一概念也被用来指对于这些规则进行研究的学科,例如词法学、语法学或音韵学等,并和其他学科如语音学、语义学或语用学互相补充。在很多文献中,语言学家通常不用“语法”来指正写法。
二、语法论
叔本华先生的代表作之一为《作为意志和表象的世界》,这本书是我唯一读完三遍的哲学著作,虽然读完之后大概内容会完全忘掉,感觉却慢慢加深。世界是我的表象,整个世界的表象随着时间不断变化发展,而作为智能体的人对世界表象的反射作为思想和记忆存储在大脑里。大脑的容量总是不够的,若存储表象太困难了,还好表象与本质有本质的联系,其中有一种联系:叫做规则,有时候人存储了少量规则和少量表象,便可以了解大部分世界或者世界的大部分。
自然语言作为人类的概念工具,是世界表象的映射,若语言对表象世界的描述是双射的,那么这种自然语言便是无二义性的。只是现代语言其丰富度还难以精细描述表象世界,有意或者无意之间借助于规则,语言对世界的描述层面一般显示出二义性。
自然语言的天生二义性缓慢演进,暂且搁置。自然语言是世界的一个很好的表象描述,分析自然语言可以对其代表的本质——自然世界有一个很好的理解。
自然语言对世界的描述,形式化为“语义”,即是我们所说的“概念”。自然语言的表现有其内在要求,这就是语法,即是自然语言的规则。自然语言是一个AI难的问题,根本在于世界太复杂,对世界的描述必须上升到 智能 的水平,必须了解“智能” 的含义。
“智能”最主要的一个方面是可演进性,智能首先是一个系统,系统要素最终使系统进化或者灭亡。进化的“智能”更好的与世界适应,富否则灭亡。
再回到哲学,黑格尔的哲学 语义价值 受到马克思先生的极大批判,但其学说曾经如此流行,必有过人的地方,这就是黑格尔的 辩证法。哲学不能否认前向链和因果论的正确性,这是一切系统运行的基础。黑格尔的逻辑辩论能力非常强大,对哲学思想这个语义系统的语法——逻辑推理运用的恰到好处,才奠定了他在哲学的地位。
一个好的语法系统可以构建一个强有力的语义系统.....
语义 的模型论 和语法的证明论 关联 暂时还不明白...。
二、语义论
专家系统所阐述的语义为知识状态,通过逻辑规则进行推理,得到终止状态即解决方案。维基的阐述:专家系统适合于完成那些没有公认的理论和方法、数据不精确或信息不完整、人类专家短缺或专门知识十分昂贵的诊断、解释、监控、预测、规划和设计等任务。一般专家系统执行的求解任务是知识密集型的。
维基的中文解释不是特正确,专家系统的确定性是专家系统的内在要求之一,具有模糊逻辑的专家系统其本质上是确定的。
值得修改的地方是:专家系统使用的是有确定的公理和方法的系统。即使具有模糊规则,模糊规则的可能性概率必须是可以预测的,这才符合我们对科学可验证的初始要求。专家系统更符合语义系统的追逐——完备性,专家系统的语义系统必须是完备的,从任何一个初始状态出发,经过一系列的推理规则,不能得到矛盾的结果。
而机器学系系统呢,对于完备性的映射是“过拟合”。 过拟合同于目标泄露。
专家系统的可以形式化为状态机模型。有限状态机(英语:finite-state machine,缩写:FSM)又称有限状态自动机,简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。
FSM(有限状态机)可以使用上面图1那样的状态图(或状态转移图)来表示。此外可以使用多种类型的状态转移表。下面展示最常见的表示:当前状态(B)和条件(Y)的组合指示出下一个状态(C)。完整的动作信息可以只使用脚注来增加。包括完整动作信息的FSM定义可以使用状态表。
-
-
状态转移表 当前状态→
条件↓状态A 状态B 状态C 条件X … … … 条件Y … 状态C … 条件Z … … …
-
专家系统是一个反复验证扩增的过程。专家是基于规则的系统,规则的粒度决定了专家系统正确性和稳定性,一般两种特性不可得兼。专家系统的语义是稀疏的,规则的粒度决定语义的表达空间疏密程度。语义的完备性要求状态点可以完全且唯一解析。若状态点不能被规则系统解析,一个可行的方法为规则细分化,通过增加语义空间密度来解析状态点。同样若状态点得到了矛盾的解析,可行的方法为规则细分化,或者修改规则。在修改规则和规则细分化的同时,仍然要保持语义的完备性,遍历整个专家系统状态。
机器学习呢,可以看做是侧重于专家系统的规则提取过程的专家系统预处理方法。若规则是显式的,且必须保持完备性,则为专家系统;若规则难以描述,则是神经网络。贝叶斯网络也是专家系统的一中,MCMC方法依然可以划分为规则系统的范畴。
三、机器学习
机器学习侧重于规则的正确性,通过模型的泛化性能来调整机器学习规则粒度和规则走向(参数),与专家系统的完备性要求侧重点不同。ML的模型又称为算法,机器学习与泛函分析联系紧密。
对于世界模型的实例分类,同态于名词范畴,林奈分类法是一个成功的实例。先验经验和特征提取的隐式规则 是世界表象的本质联系所决定的。为何一直推崇标准建类模型?标准建类模型意指使用标准的建类规则,使用合适的类定义粒度,合适的类划分层次,拟合世界表象的概念模型,促进计算机语义描述的标准化和拟人化。
对于世界模型的联系分类,同态于动词范畴,联系范畴的定义比名词少的多,谓词的细分化比主宾的细分化要简单的多,名词的组合规则复杂,生成的实例多样纷杂。而联系可以被隔离,实例系统具有相似性,实体组合新名词一个联系发生变化便可以产生新的实体,从此意义上说,联系的量级为实体的ln级别。动词的一个特性便是可以泛化,类似于计算机语言设计C++中的规则“多态”或者JAVA中的“借口”。多态和接口的实现极大地减少了语言描述世界的复杂度。
名词代表的实例通过和其他实例或联系,服从特定的“组合规则”,构建无限可能多的组合,深刻的阐述了“组合爆炸”这个特性。实例的粒度和实例的量级有着千丝万缕的关系,实例的内部和外部联系构建规则。规则或许和联系从属于一个量级,规则也许和联系可以封装。
1.机器学习对实例的分类受到实例粒度和实例组分复杂度的限制,表现为特征工程的特征抽取维度。即使是离散空间,实例粒度越小、实例组分越多,特征维度越高,机器学习的模型必然会更复杂,就像“英国的海岸线”一样。从这个尺度上说,机器学习对规则的抽取性能一开始就是被限定的。
机器学习对实例的判别模型与专家系统对状态的解析模型类似。
特征工程是机器学习最重要的部分。使用人力对实例进行特征提取,企图希望用X个维度的(离散/连续)特征(数)值来描述无限维度的表象世界,期待特征是表象实例的单射,这个过程使用了大量的经验。特征工程有一劳永逸的方法吗?应该没有吧!人力在应用目标和表象初始状态中构建特征提取规则,这是一个基于规则的特征提取专家系统,会表现出专家系统的所有特征。
图像模式识别是一个“AI”难的过程,因为特征工程的专家系统构建过程是一个真正的智能过程,而我们所谓的“语义鸿沟”是因为我们追逐极度降维,仍然能保持概念映射的单射性质。
2.机器学习对联系的分类会简单的多,因为联系的特征一般是明晰的,维度也较低。对规则抽取规则,引入元机器学习。
四、元机器学习
证明语义完备性的理论为模型论,证明语法完备性的理论为证明论。人工智能一定会实现的,且强人工智能一定会实现的,只是一旦他实现,若不依赖于与人类似的自然资源,那么他会为自身的生存构建一个更合适的自然界,这才是生存争夺战的源头。
我们构建了“三北防护林”,抵挡沙漠,因为我们所依赖的资源不能从沙漠这种环境中获取。经济基础决定上层建筑,人类意识不可能对自身躯壳不加保护,人类躯壳所需要的存在资本依然与这个自然界不可分割。
状态的转换需要能量,我们需要消化作用,需要食物和氧气。我们更需要这个躯壳正常的运行,保持能量源源不断地可以被供应,维持意识的状态转变。我们更需要这个能量机器稳定存在的环境并实施对她维护,因此我们和这个原始自然界有着千丝万缕的联系。
森林和海洋用于光合作用产生氧气和食物,我们不能永远地开辟城市到任何地方。还要保证能量产生机器的正常运转,因此治理“雾霾”。保证洁净的饮用水作为能量载体,和能量产生的重要容器。
智能的原因还未能探测到,因此,“元认知“还是处于哲学的认知阶段。对人类智能的认识不仅是自然界和科学本身在阻碍,生存本能的延伸——伦理也在限制这 对认知/智能的剖析,元认知的过程困难重重。
幸好,机器学习系统是人类专家从0开始构建的系统,机器学习的整个模型生成的规则是可以被公理化描述,规则的规则也可以被描述,深入到”元机器学习“。
对机器学习这个专家系统来解析一番,进入元认知的阶段。
五、模型的复杂度和完备性
专家系统的完备性和机器学习的完备性不在一个层次,专家系统的完备性为语义的完备性,是一个永无止境的过程。机器学习系统的完备性是语法的完备性,可以 从逻辑 层面得到严谨的证明。
那么机器学习的完备性便是证明整个规则的正确性。
一个机器学习系统,构建一个专家系统,然后构建过程依赖了控制系统。