计算理论——正则语言,上下文无关文法,图灵机,可判定性,可规约性

目录

第一章 正则语言 

状态图 

自动机的形式化定义

非确定性

正则表达式

泵引理

使用泵引理证明某个语言非正则的方法 

第二章 上下文无关文法

上下文无关文法概述

 1、上下文无关文法形式化定义

2、上下文无关文法举例

 3、设计上下文无关文法

4、歧义性 

5、乔姆斯基范式

下推自动机

1、下推自动机的定义

 2、下推自动机三个例子

从CFG构造PDA的算法和例子(难以理解)

从PDA构造CFG的算法了例子(难以理解)

非上下文无关语言

上下文无关语言的泵引理

 上下文无关语言的泵引理证明(看不懂 过)

上下文无关语言的泵引理举例

第三章 图灵机

图灵机

图灵机的定义

第一个例子

第二个例子

第三个例子

图灵机的变形 

多带图灵机

非确定图灵机

枚举器 ​ 

算法

第四章 正则语言的可判定问题

DNF接受型问题

NFA接受型问题

正则表达式派生性问题

DFA空性问题

DFA等价性问题

与上下文无关语言相关的可判定问题

上下文无关文法派生问题

上下文无关文法的空性问题

每个CFL是可判定的

 不可计算问题

使用计数法

使用对角化方法

一个非图灵可识别语言(图灵不可识别)

第五章 规约

HALT(TM)  图灵机停机问题 

Etm问题 

 REGULARTM检查一个给定的图灵机是否有一个等价的有穷自动机:图灵机的正则性问题:

EQ(TM)两个图灵机是否等价是不可判定的. 

利用计算历史的公约

线性界限自动机 

LBA接受性问题

ELBA:LBA空性问题

ALL(CFG)一个文法派生出所有可能的串是不可判定的

映射可归约性



集合{}

序列()

多元组——有穷序列

k元组——k个元素的有穷序列

k元函数——k个自变量的函数

第一章 正则语言 

状态图 

自动机的形式化定义

A 是机器 M 接受的全部字符串集,则称 A 是机器 M 的语言,记作 L(M)=A又称 M 识别 A M 接受 A

可以看出M2接受所有以1结束的字符串,于是L(M1)={w|w以1结束} 

如果机器结束在接受状态,则接受它的输入,如果A={w|}

如果一个语言被一台有穷自动机识别,则称它是正则语言

正则运算,定义正则运算

如果A1和A2是正则语言,则A1∪A2也是正则语言。

如果A1和A2是正则语言,则A1连结A2也是正则语言。

非确定性

确定性:当机器处于给定的状态并读入下一个输入符号时,可以知道机器的下一个状态是什么

 非确定性:在任何一点,下一个状态可能存在若干个选择。

DFA(确定型有穷自动机)

NFA (非确定型有穷自动机)

q1对于1有两个输出

q2对于1没有输入

有一个带\varepsilon的箭头

NFA计算过程:拿上面那个NFA为例,在读入1后,机器会把自己分裂为多个备份,并且并行的执行所有的结果。各个子过程分别的进行,如果这些子过程中至少有一个接受,那么整个计算接受。

另一个办法是树

 每一台NFA都可以转换成一台等价的DFA

NFA的形式化定义

正则表达式

正则表达式的值表示的是一个语言。这个式子的意思是一个0或一个1(只能一个,即要么是0要么是1 两个不能一起有)后面跟着任意个0的所有字符串组成的语言。

\Sigma为{0,1}那么就可以用\Sigma表示上面正则表达式的缩写。

如果设是任意的字母表,那么\Sigma表示的是所有该字母表上所有长度为1的字符串组成的语言,而\Sigma ^{*}表示的是该字母表上所有字符串组成的语言。\Sigma ^{*}1表示的是所有以1结尾的字符串的语言。

\Sigma代表的是任意一个字母,头上带个※代表的是任意个字母,

 

 上面这个1前面的字母可以任意,但是一定有三个1

正则语言类在并运算下封闭

正则语言类在连接运算下封闭

正则语言类在星运算下封闭

正则表达式的例子

S ={ 0, 1 },则可以用 S  作为 (01) 的缩写。

S *  表示该字母表上的所有字符串组成的语言。

S *1 是包含所有以 1 结尾的字符串的语言。

(0S * )∪(S *1) 由所有以 0 开始或者以 1 结尾的字符串组成。

泵引理

某些字符串都包括一段子串,把这段子串重复任意次,得到的字符串仍在这个语言中。

若A是一个正则语言,则存在一个数p(泵长度)使的,如果s是A中任一长度不小于p的字符串,那么s可以被分为3段,s=xyz,满足下列条件

泵引理特别像一个管子,x是进入泵的,yi是在泵里旋转,z再出来,这个字符串加起来的长度不能小于p也就是xy要小于p,加上z就大于p,遮掩是为了让这三部分都存在。

 

使用泵引理证明某个语言非正则的方法 

 拿一个当做例子 (下面这个例子只是用了和s矛盾)

 

下面这个就不看了 

 

 下面还有个例子

第二章 上下文无关文法

上下文无关文法能够描述某些应用广泛的具有递归结构特征的语言

L(G1) 表示文法 G1 产生的语言。

L(G1) = { 0n#1n | n ³ 0 }

上下文无关文法概述

 1、上下文无关文法形式化定义

2、上下文无关文法举例

 3、设计上下文无关文法

4、歧义性 

有时在一个文法中能够用几种不同的方式产生出同一个字符串

该字符串有两棵不同的语法分析树,而不是两种不同的派生,两种不同的派生可能仅仅是替换变元的次序不同而不是整个结构的不同。

每一步都是替换最左边剩下的变元,称整个派生是最左派生

对于字符串,每次都是先替换最左边的

使用哪种规则没有限制,只要替换了就行

但某些上下文无关语言只能用歧义文法产生,这种被称为固有歧义的。

5、乔姆斯基范式

满足规则 二叉树 要么变俩,要么终止

往下生长时要么变俩,要么就终止变成叶子

将上下文无关语言都转化为乔姆斯基范式 看考试期末题整理文章

下推自动机

相比有穷自动机而言多了一个栈。

1、下推自动机的定义

 

 2、下推自动机三个例子

判断0n1n 

下面图里的俩数,第一个是变为某个状态,第二个是栈顶元素,如果是0,那么就是加入0,如果是s,那就是弹出

从CFG构造PDA的算法和例子(难以理解)

从PDA构造CFG的算法了例子(难以理解)

非上下文无关语言

上下文无关语言的泵引理

 上下文无关语言的泵引理证明(看不懂 过)

上下文无关语言的泵引理举例

下面证明第二个 会比较长

第一种情况 含一种符号

 第二种情况

第三个例子

 我觉得u至少会占一个p

 课后习题上有剩下的证明

第三章 图灵机

 

图灵机

图灵机的定义

第一个例子

 形式化描述

上图的状态图(画画才能看出来)

第二个例子

 状态图

第三个例子

图灵机的变形 

多带图灵机

非确定图灵机

?表示当前状态还未停机 

广度优先,防止在某个分支里永远不停机

只要有一个分支是接收,那么就是接受

 

 


枚举器  

 图灵机识别等价与枚举

证明这里不加证明了,如果后来有考的回来再补充

算法

 算法可解:存在处处停机的算法

研究不可解的意义——证明有些问题不能用算法解决避免做无用功

可判定语言

第四章 正则语言的可判定问题

有下列五种问题

DNF接受型问题

给定一个有穷自动机,给定一个串,问是否有穷自动机会接受这个串。

等价于        Adfa是可判定的   

 

NFA接受型问题

给定一个非确定型自动机,给定一个串,问是否非确定型自动机会接受这个串

 详细细节

正则表达式派生性问题

给定一个正则表达式,给定一个串,问是否正则表达式是否接受这个串

 

DFA空性问题

给定一个自动机问是否这个自动机根本不接受任何串 

 

DFA等价性问题

给两个有穷自动机,问这两个有穷自动机是不是等价的

 

与上下文无关语言相关的可判定问题

上下文无关文法派生问题

检查一个上下文无关文法是否派生一个特定的串(给一个文法,给一个串,问是否文法能够派生出这一个串来)

 使用乔姆斯基范式去判断

上下文无关文法的空性问题

检查一个上下文无关文法是否不派生任何串

 

每个CFL是可判定的

使用判定ACFG的TM S

 不可计算问题

使用计数法

所以图灵机个数是可数的,所以全体图灵可识别语言也是可数的。 

使用对角化方法

证明ATM是不可判定的

ATM={ <M,w> | TM M接受串w }

这里设  DTM={ <M> | TM M接受串<M> }      (由于图灵机是编码,将图灵机M当做编码加入图灵机)  DTM是ATM的特例

这里有个图

图灵机仅能找到接受的,拒绝的会进入循环,使用H方法去将拒绝表示出来 

 

 

D方法是H方法的相反 

 

如果<D>的话会出现矛盾, 

 

一个非图灵可识别语言(图灵不可识别)

A可判定与A和A的补图灵可识别等价

 判断正确性

 

 所以语言类的关系

第五章 规约

规约

把事情A归结为事情B

   如果事情B能做,那么事情A就能做 ,如果不能做A,就不能做B

HALT(TM)  图灵机停机问题 

 这个语言是在w上停机,停机有可能接受,也有可能拒绝

假设有这个,那么通过可以判定Atm的s来证明自己不存在

因此如果想证明某个不成立,先假设其成立,然后用那个图灵机去构造某个图灵机去判定Atm成立

Etm问题 

 REGULARTM检查一个给定的图灵机是否有一个等价的有穷自动机:图灵机的正则性问题:

语言

REGULARTM={ <M> | MTM

                                    L(M)正则  }

还是用上面的方法,如果我接受,那么我输出一个正则的,如果不接受或者不停机输出一个非

 应该是如果M接受w那么就输出正则语言,如果M不接受w或者循环那么不输出什么东西

这样后面的会判断是否是正则语言,而只有M接受w输出正则语言,所以能够判断出来,上面我觉得有点问题,或者我理解出了问题。

EQ(TM)两个图灵机是否等价是不可判定的. 

利用计算历史的公约

线性界限自动机 

所以一共有上面这个步数,因此如果在这个步数里没有结束则拒绝,如果在步数里,接受了则接受,拒绝了则拒接 

LBA接受性问题

ELBA:LBA空性问题

检测一个给定的线性界限自动机是否根本不接受任何串

        语言ELBA={<M>|MLBAL(M)=Æ}

如果它不接受任何串,和前面判断空的一样,

如果经过以后是接收了这个,那么我输出一个非空的结果,在经过这个判断非空的会输出拒          绝,这时我再接受,

如果经过以后是拒绝或者停机了,那么我不输出,在经过这个判断非空的会输出接受,这时我再拒绝。

ALL(CFG)一个文法派生出所有可能的串是不可判定的

映射可归约性

用映射可归约性将问题 A 归约为问题 B 是指,存在一个可计算函数,它将问题 A 的实例转换成问题 B 的实例

可计算函数可以是机器的描述之间的变换

语言 A 映射可归约到语言 B 的,如果存在可计算函数 f : S*®S* 使得对每个 w

                         wA Û f (w) ∈B

记作AmB。称函数 f A B 归约

如果 AmB B 是可判定的,则 A 也是可判定的。

如果 AmB A 是不可判定的,则 B 也是不可判定的。

如果 AmB,且 B 是可图灵可识别的,则 A 也是图灵可识别的。

如果 Am B,且 A 不是图灵可识别的,则 B 也不是图灵可识别的。

EQTM 既不是图灵可识别的,也不是补图灵可识别的。

posted @ 2022-05-15 21:48  贪睡地蜗牛  阅读(1171)  评论(0编辑  收藏  举报