《编译原理》西北工业大学第三版课后答案

文档格式：DOCX| 139 页|大小 418.59KB|积分 15|2022-10-24 发布|文档ID：164021265

下载文档

下载文档到电脑，查找使用更方便还剩页未读，继续阅读>>

侵权申诉举报

1 / 139

此文档下载收益归作者所有下载文档

版权提示

文本预览

常见问题

第一章绪论 1.1何谓源程序、目标程序、翻译程序、编译程序和解释程序?它们之间可能有何种关系? 1.2一个典型的编译系统通常由哪些部分组成?各部分的主要功能是什么? 1.3选择一种你所熟悉的程序设计语言，试列出此语言中的全部关键字，并通过上机使用该语言以判明这些关键字是否为保留字 1.4选取一种你所熟悉的语言，试对它进行分析，以找出此语言中的括号、关键字END以及逗号有多少种不同的用途 1.5试用你常用的一种高级语言编写一短小的程序，上机进行编译和运行，记录下操作步骤和输出信息，如果可能，请卸出中间代码和目标代码参考答案第一章习题解答1. 解：源程序是指以某种程序设计语言所编写的程序目标程序是指编译程序（或解释程序）将源程序处理加工而得的另一种语言（目标语言）的程序翻译程序是将某种语言翻译成另一种语言的程序的统称编译程序与解释程序均为翻译程序，但二者工作方法不同解释程序的特点是并不先将高级语言程序全部翻译成机器代码，而是每读入一条高级语言程序语句，就用解释程序将其翻译成一段机器指令并执行之，然后再读入下一条语句继续进行解释、执行，如此反复即边解释边执行，翻译所得的指令序列并不保存。

编译程序的特点是先将高级语言程序翻译成机器语言程序，将其保存到指定的空间中，在用户需要时再执行之即先翻译、后执行 2. 解：一般说来，编译程序主要由词法分析程序、语法分析程序、语义分析程序、中间代码生成程序、代码优化程序、目标代码生成程序、信息表管理程序、错误检查处理程序组成 3. 解：C语言的关键字有：auto break case char const continue default do double else enum extern float for goto if int long register return short signed sizeof static struct switch typedef union unsigned void volatile while上述关键字在C语言中均为保留字 4. 解：C语言中括号有三种：{}，[]，（）其中，{}用于语句括号；[]用于数组；（）用于函数（定义与调用）及表达式运算（改变运算顺序）C语言中无END关键字逗号在C语言中被视为分隔符和运算符，作为优先级最低的运算符，运算结果为逗号表达式最右侧子表达式的值（如：(a,b,c,d)的值为d）。

5. 略第二章前后文无关文法和语言 21设有字母表A1={a,b,…,z}，A2={0,1,…,9}，试回答下列问题： (1) 字母表A1上长度为2的符号串有多少个? (2) 集合A1A2含有多少个元素? (3) 列出集合A1 (A1∪A2)*中的全部长度不大于3的符号串 22试分别构造产生下列语言的文法 (1) {anbn|n≥0}； (2) {anbmcp|n,m,p≥0}； (3) {an#bn|n≥0}∪{cn#dn|n≥0}； (4) {w#wr#|w∈{0,1}*，wr是将w中的符号按逆序排列所得的符号串}； (5) 任何不是以0开始的所有奇整数所组成的集合； (6) 所有由偶数个0和偶数个1所组成的符号串的集合 23试描述由下列文法所产生的语言的特点 (文法的开始符号均为S) (1) S→10S0S→aAA→bAA→a (2) S→SSS→1A0A→1A0A→ε (3) S→1AS→B0A→1AA→C B→B0B→CC→1C0C→ε (4) S→bAdcA→AGSG→εA→a (5) S→aSSS→a 24设已给文法G=(VN,VT,P,S)，其中： VN={S} VT={a1,a2,…,an,∨,∧, ~, ［,］} P={S→ai|i=1,2,…,n}∪{S→~S,S→［S∨S］,S→［S∧S］}，试指出此文法所产生的语言。

25考察文法G=(VN,VT,P,S)，其中： VN={S,A,B,C,D,E,F,G} VT={a}, P={S→ABC,C→BC,C→A,BA→GE,BG→GBF,AG→AD, DB→BD,DE→AE,FB→BF,FE→Ea,AA→ε} (1) 指出此文法的类型； (2) 证明此文法所产生的语言为 L(G)={at(n)|n≥1} t(n)=∑n[]i=1i 26设已给文法G［〈程序〉］：〈程序〉→〈分程序〉|〈复合语句〉〈分程序〉→〈无标号分程序〉|〈标号〉：〈分程序〉〈复合语句〉→〈无标号复合语句〉|〈标号〉：〈复合语句〉〈无标号分程序〉→〈分程序首部〉；〈复合尾部〉〈无标号复合语句〉→begin〈复合尾部〉〈分程序首部〉→begin〈说明〉|〈分程序首部〉；〈说明〉〈复合尾部〉→〈语句〉end|〈语句〉；〈复合尾部〉〈说明〉→d 〈语句〉→s 〈标号〉→L (1) 给出句子 L: L: begin d; d; s; s end 的最左推导和最右推导 (2) 画出上述句子的语法树 27设已给文法G［S］： S→aAcBS→BdSB→aScAB→cAB A→BaBA→aBcA→aB→b 试检验下列符号串中哪些是G［S］中的句子，给出这些句子的最左推导、最右推导和相应的语法树。

(1) aacb (2) aabacbadcd (3) aacbccb (4) aacabcbcccaacdca (5) aacabcbcccaacbca 28设G=(VN,VT,P,S)为CFG，α1,α2,…,αn为V上的符号串，试证明：若 α1α2…αn*β 则存在V上的符号串β1,β2，…,βn，使β=β1β2…βn，且有 ai*βi(i=1,2,…,n) 29设G=(VN,VT,P,S)为CFG，α和β都是V上的符号串，且α*β，试证明：当α的首符号为终结符号时，β的首符号也必为终结符号；当β的首符号为非终结符号时，则α的首符号也必为非终结符号 210试证明：文法 S→ABS→DCA→aAA→a B→bBcB→bcC→cCC→c D→aDbD→ab 为二义性文法 211对于下列的文法和相应的句子，试指出这些句子的全部短语；分别给出句子的最右推导，并指出各步直接推导所得句型的句柄 (1) S→ABS→cA→bAA→aB→aSbB→c bbaacb (2) S→(AS)S→(b)A→(SaA)A→(a) (((b) a (a)) (b)) (3) E→ET+E→TT→TF*T→FF→FP↑F→PP→EP→i iii*i+↑ 212在自底向上的分析中，用来归约句型句柄的产生式称为句柄产生式。

试证明：一个文法是无二义性的，当且仅当此文法的每一句型至多只有一个句柄和一个句柄产生式 213化简下列各个文法 (1) S→aABSS→bCACdA→bABA→cSA A→cCCB→bABB→cSBC→cS C→c (2) S→aABS→EA→dDAA→e B→bEB→fC→cABC→dSD C→aD→eAE→fAE→g (3) S→acS→bAA→cBCB→SA C→bCC→d 214消去下列文法中的ε产生式 (1) S→aASS→bA→cSA→ε (2) S→aAAA→bAcA→dAeA→ε 215消去下列文法中的无用产生式和单产生式 (1) S→aBS→BCA→aAA→c A→aDbB→DBB→CD→B C→b (2) S→SAS→SBA→BB→［S］ A→(S)S→AB→［］A→( ) (3) E→E+TE→TT→T*FT→F F→P↑FF→PP→(E)P→i 参考答案第二章习题解答 1.（1）答：26*26=676 （2）答：26*10=260 （3）答：{a,b,c,...,z,a0,a1,...,a9,aa,...,az,...,zz,a00,a01,...,zzz},共26+26*36+26*36*36=34658个2.构造产生下列语言的文法（1）{anbn|n≥0} 解：对应文法为G(S) = ({S},{a,b},{ S→ε| aSb },S) （2）{anbmcp|n,m,p≥0} 解：对应文法为G(S) = ({S,X,Y},{a,b,c},{S→aS|X,X→bX|Y,Y→cY|ε},S) （3）{an # bn|n≥0}∪{cn # dn|n≥0} 解：对应文法为G(S) = ({S,X,Y},{a,b,c,d,#}, {S→X, S→Y,X→aXb|#,Y→cYd|# },S) （4）{w#wr# | w?{0,1}*,wr是w的逆序排列} 解：G(S) = ({S,W,R},{0,1,#}, {S→W#, W→0W0|1W1|# },S) （5）任何不是以0打头的所有奇整数所组成的集合解：G(S) = ({S,A,B,I,J},{-,0,1,2,3,4,5,6,7,8,9},{S→J|IBJ,B→0B|IB|e, I→J|2|4|6|8, Jà1|3|5|7|9},S) （6）所有偶数个0和偶数个1所组成的符号串集合解：对应文法为 S→0A|1B|e，A→0S|1C B→0C|1S C→1A|0B3.描述语言特点（1）S→10S0S→aAA→bAA→a 解：本文法构成的语言集为：L(G)={(10)nabma0n|n, m≥0}。

（2）S→SS S→1A0A→1A0A→ε 解：L(G)={1n10n11n20n2 … 1nm0nm |n1,n2,…,nm≥0；且n1,n2,…nm不全为零}该语言特点是：产生的句子中，0、1个数相同，并且若干相接的1后必然紧接数量相同连续的0 （3）S→1AS→B0A→1AA→CB→B0B→CC→1C0C→ε 解：本文法构成的语言集为：L(G)={1p1n0n|p≥1,n≥0}∪{1n0n0q|q≥1,n≥0}，特点是具有1p1n0n 或1n0n0q形式，进一步，可知其具有形式1n0mn,m≥0,且n+m>0 （4）S→bAdcA→AGSG→εA→a 解：可知，S=>…=>baSndc n≥0 该语言特点是：产生的句子中，是以ba开头dc结尾的串,且ba、dc个数相同（5）S→aSSS→a 解：L(G)={a(2n-1)|n≥1}可知：奇数个a4.解：此文法产生的语言是：以终结符a1 、a2 …an 为运算对象，以∧、∨、~为运算符，以[、]为分隔符的布尔表达式串5. 5.1解：由于此文法包含以下规则：AA→e，所以此文法是0型文法 5.2证明：略6.解：（1）最左推导：<程序>T<分程序>T<标号>：<分程序>TL：<分程序>TL：<标号>：<分程序>T L：L：<分程序>T L：L：<无标号分程序>T L：L：<分程序首部>；<复合尾部>T L：L：<分程序首部>；<说明>；<复合尾部>T L：L：begin<说明>；<说明>；<复合尾部>T L：L：begin d；<说明>；<复合尾部>T L：L：begin d；d；<复合尾部>T L：L：begin d；d；<语句>；<复合尾部>T L：L：begin d；d；s；<复合尾部.T L：L：begin d；d；s；<语句> endT L：L：begin d；d；s；s end最右推导：<程序>T<分程序>T<标号>：<分程序>T<标号>：<标号>：<分程序>T<标号>：<标号>：<无标号分程序>T<标号>：<标号>：<分程序首部>；<复合尾部>T<标号>：<标号>：<分程序首部>；<语句>；<复合尾部>T<标号>：<标号>：<分程序首部>；<语句>；<语句>；endT<标号>：<标号>：<分程序首部>；<语句>；s；endT<标号>：<标号>：<分程序首部>；s；s；endT<标号>：<标号>：<分程序首部>；说明；s；s；endT<标号>：<标号>：<分程序首部>；d；s；s；endT<标号>：<标号>：begin 说明；d；s；s；endT<标号>：<标号>：begin d；d；s；s；endT<标号>： L：begin d；d；s；s；endTL：L：begin d；d；s；s；end（2）句子L：L：begin d；d；s；s end的相应语法树是：7.解：aacb是文法G[S]中的句子，相应语法树是：最右推导：S=>aAcB=>aAcb=>aacb最左推导：S=>aAcB=>aacB=>aacb（2）aabacbadcd不是文法G[S]中的句子因为文法中的句子不可能以非终结符d结尾（3）aacbccb不是文法G[S]中的句子可知，aacbccb仅是文法G[S]的一个句型的一部分，而不是一个句子。

4）aacabcbcccaacdca不是文法G[S]中的句子因为终结符d后必然要跟终结符a，所以不可能出现…dc…这样的句子5）aacabcbcccaacbca不是文法G[S]中的句子由（1）可知：aacb可归约为S，由文法的产生式规则可知，终结符c后不可能跟非终结符S，所以不可能出现…caacb…这样的句子8.证明：用归纳法于n，n=1时，结论显然成立设n=k时，对于α1α2...αkT*b,存在βi：i=1,2,..,k，αiT*bi成立，现在设α1α2... αkαk+1T*b，因文法是前后文无关的，所以α1α2... αk可推导出b的一个前缀b'，αk+1可推导出b的一个后缀=b"(不妨称为b k+1)由归纳假设，对于b'，存在βi ：i=1,2,..,k，b'=β1β2...βk,使得αiT*bi成立，另外,我们有αk+1T*b"(=b k+1）即n=k+1时亦成立9.证明：(1)用反证法假设α首符号为终结符时，β的首符号为非终结符即设：α=aω；β=Aω’且 α=>*β由题意可知：α=aωT …T Aω’=β，由于文法是CFG，终结符a不可能被替换空串或非终结符，因此假设有误。

得证；（2）同（1），假设：β的首符号为非终结符时，α首符号为终结符即设：α=aω；β=Aω’且α=aωT …T Aω’=β，与（1）同理，得证10.证明：因为存在句子：abc，它对应有两个语法树（或最右推导）：STABTAbcTabcSTDCTDcTabc所以，本文法具有二义性11.解：(1) STABTAaSbTAacbTbAacbTbbAacbTbbaacb上面推导中，下划线部分为当前句型的句柄对应的语法树为：全部的短语：第一个a (a1)是句子bbaacb相对于非终结符A (A1) (产生式A?a）的短语（直接短语）；b1a1是句子bbaacb相对于非终结符A2的短语；b2b1a1是句子bbaacb相对于非终结符A3的短语；c是句子bbaacb相对于非终结符S1（产生式S?c）的短语（直接短语）；a2cb3是句子bbaacb相对于非终结符B的短语；b2b1a1a2cb3是句子bbaacb相对于非终结符S2的短语；注：符号的下标是为了描述方便加上去的2）句子（（（b）a（a））（b））的最右推导：ST（AS）T（A（b））T（（SaA）（b））T（（Sa（a））（b））T（（（b）a（a））（b））相应的语法树是：（3）解：iii*i+↑对应的语法树略。

最右推导：E TT=>F=>FP↑T FE↑T FET+↑T FEF+↑T FEP+↑T FEi+↑TFTi+↑T FTF*i+↑TFTP*i+↑T FTi*i+↑TFFi*i+↑T FPi*i+↑TFii*i+↑T Pii*i+↑Tiii*i+↑12.证明：充分性：当前文法下的每一符号串仅有一个句柄和一个句柄产生式T对当前符号串有唯一的最左归约T对每一步推导都有唯一的最右推导T有唯一的语法树必要性：有唯一的语法树T对每一步推导都有唯一的最右推导T对当前符号串有唯一的最左归约T当前文法下的每一符号串仅有一个句柄和一个句柄产生式13.化简下列各个文法（1）解：S→bCACdA→cSA| cCCC→cS | c（2）解：S→aAB | fA | gA→e | dDAD→eAB→f（3）解：S→ac14.消除下列文法中的ε产生式（1）解：S→aAS | aS | bA→cS（2）解：S→aAA | aA | aA→bAc| bc | dAe| de15.消除下列文法中的无用产生式和单产生式（1）消除后的产生式如下：S→aB | BCB→DB | bC→bD→b | DB（2）消除后的产生式如下：S→SA | SB |（）|（S）|[] |[S]A→() |（S）|[]|[S]Bà[] |[S]（3）消除后的产生式如下：E→E+T | T*F | (E) | P↑F | iT→T*F | (E) | P↑F | i F→P↑F | (E) | i P→(E) | i 第三章词法分析及词法分析程序 3.1试用某种高级语言编写一个FORTRAN源程序的预处理子程序，其功能是：每调用它一次，即把源程序中的一个完整语句送入扫描缓冲区。

要求删去语句中的注释行；删去续行标记字符，把语句中的各行连接起来，并在语句的末端加上语句结束符此外，还要求此程序具有组织源程序列表输出的功能 3.2画出用来识别如下三个关键字的状态转移图 STEP STRING SWITCH 3.3假定有一个猎人带着一只狼、一头山羊和一棵白菜来到一条河的左岸，拟摆渡过河，而岸边只有一条小船，其大小仅能装载人和其余三件东西中的一件，也就是说，每一次猎人只能将随行者中的一件带到彼岸若猎人将狼和山羊留在同一岸上而无人照管，那么，狼就会将羊吃掉；如果猎人把山羊和白菜留在同一岸，山羊也会把白菜吃掉现在，请你用状态转换图作为工具，描述猎人可能采取的种种摆渡方案，并从中找出可将上述三件东西安全地带到右岸的方案来 3.4设已给文法G=(VN,VT,P,S)，其中，P仅含形如 A→αBA→αα∈V*T，B∈VN 的产生式，试证明：由此种文法所产生的语言是一正规语言 3.5试证明：任何有限个符号串所组成的集合 L={x1,x3,…,xn}xi∈Σ+ 都是3型语言 3.6试构造一右线性文法，使得它与如下的文法等价 S→ABA→UTU→a|aU T→b|bTB→c|cB 并根据所得的右线性文法，构造出相应的状态转换图。

3.7对于如题图37所示的状态转换图 (1) 写出相应的右线性文法； (2) 指出它接受的最短输入串； (3) 任意列出它接受的另外四个输入串； (4) 任意列出它拒绝接受的四个输入串题图37 3.8对于有限自动机 M=(K,Σ,f,S0,Z) 其中，K={S0,S1,S2,S3,S4,S5},Σ={a,b},Z={S1,S4,S5} f由如下的状态转移矩阵给出： []a[]bS0[]S2[]S1S1[]S3[]S1S2[]S0[]S4S3[]S0[]S0S4[]S5[]S4S5[]S4[]S0 试找出一个长度最小的输入串，使得： (1) 在识别此输入串的过程中，每一状态至少经历一次； (2) 每一状态转换至少经历一次 3.9对于下列的状态转换矩阵： []a[]bS[]A[]SA[]A[]BB[]B[]B(i) 初态：S 终态：B[][][]a[]bS[]A[]BA[]B[]AB[]B[]B(ii) 初态：S 终态：A[]a[]bS[]A[]BA[]C[]AB[]B[]CC[]C[]C(iii) 初态：S 终态：A,C[][][]a[]bS[]A[]SA[]C[]BB[]B[]CC[]C[]C(iv) 初态：S 终态：C (1) 分别画出相应的状态转换图； (2) 写出相应的3型文法； (3) 用自然语言分别描述它们所识别的输入串的特征。

3.10对于下面所给的文法： G1=({S,A,B,C,D}, {a,b,c,d},P1,S) P1由如下产生式组成： S→aAS→BA→abS A→bBB→bB→cC C→DD→dD→bB 以及G2=({S,A,B,C,D},{a,b,c,d},P2,S) P2由如下产生式组成： S→AaS→BA→Cc A→BbB→BbB→a C→DC→BabD→d (1) 试分别对G1和G2构造相应的状态转换图 (提示：对于右线性文法，可将形如C→D的产生式视为C→εD；而对左线性文法，则可将它视为C→Dε) (2) 对于G1，构造一等价的左线性文法G1′；对于G2构造一等价的右线性文法G2′ (3) 对于G1和G1′，分别给出如下符号串的推导序列： abbaababbbcdcbb 对于G2和G2′分别给出如下符号串的推导序列： aabaaabcadca (4) 试给出若干个不能由G1或G2产生的符号串，并验证它们同样不能用G1′和G2′产生 3.11分别构造将左线性文法转换为右线性文法以及将右线性文法转换为左线性文法的算法 3.12将如题图312所示的NFA确定化和最小化。

题图312 3.13将如题图313所示的具有ε动作的NFA确定化题图313 3.14将如题图314所示的有限自动机最小化 3.15试用一种高级语言分别写出将NFA确定化以及将DFA最小化的算法 3.16构造一产生FORTRAN语言COMMON语句的3型文法 (假定分别用λ和μ代表标识符和整常数，它们都是终结符号，且假定数组的维数不加限定)，构造相应的DFA，并写出描述COMMON语句的正规式 3.17设r,s等为任意的正规式，试证明下列的关系式成立： (1) r*=(ε|r)*=ε|rr*=(r*)* (2) (rs)*r=r(sr)* (3) (r|s)*=(r*s*)*=(r*|s*)* 3.18对于解习题36所得的文法，试用正规式描述它所产生的语言 []a[]bS0[]S1[]S5S1[]S2[]S7S2[]S3[]S5S3[]S5[]S7S4[]S5[]S5S5[]S3[]S1S6[]S3[]S0S7[]S0[]S1S8[]S3[]S8(1) 初态：S0 终态：S1，S2，S6，S7[][][]a[]bS0[]S5[]S2S1[]S6[]S2S2[]S0[]S4S3[]S3[]S5S4[]S6[]S2S5[]S3[]S0S6[]S3[]S1(2) 初态：S0 终态：S4,S5,S6题图314 3.19对于习题310所给的文法G1和G2，试分别用正规式描述它们所产生的语言。

3.20设有如下的文法G［〈标号说明〉］：〈标号说明〉→′LABEL′〈标号表〉〈标号表〉→d〈标号段〉〈标号段〉→d〈标号段〉|,〈标号〉|；〈标号〉→d〈标号段〉其中′LABEL′,′d′,′,′,′;′等为终结符号 (1) 试求出描述此文法所产生语言的正规式； (2) 构造识别此语言的具有最少状态的DFA 3.21求出描述习题37所给有限自动机所识别语言的正规式 3.22分别构造识别如下正规语言的DFA： (1) ((0*|1)(1*0))* (2) (b|a(aa*b)*b)* (3) a(abab*|a(bab)*a)*b (4) (b|aa|ac|aaa|aac)* (5) a(a|b)*b(a|b)*a(a|b)*b(a|b)* 3.23试设计一个识别器，它识别由下列英语单词： ONE, TWO, THREE, …， NINE， TEN， ELEVEN， TWELVE， THIRTEEN， …， NINETEEN， TWENTY， THIRTY， FORTY， …， NINETY， HUNDRED 所表示的从1到999间的任何整数 (各单词间用空格分隔，如THREE HUNDRED FIFTY SIX)，并将它们翻译为相应的阿拉伯数字 (如356)作为输出。

3.24设有辅助定义式 D0=a|b D1=D0D0 D2=D1D1 … Dn=Dn-1Dn-1 试回答如下问题： (1) 由Dn所表述的正规集是什么? (2) 如果将Dn中所出现的Dn-1用前面已定义的辅助定义式反复进行替换，则可最终将Dn化为Σ={a,b}上的正规式，此正规式有多长? (3) 用来识别Dn的DFA至多需要几个状态? 3.25试将LEX中的“动作子程序”Ai的功能加以扩充，使之可用来生成文本编辑程序 3.26指出下列LEX正规式所匹配的字符串： (1) "{" ［^{］*"}" (2) ^［^a-z］［A-Z］［0-9］$ (3) ［^0-9］|［＼r＼n］ (4) ＼′(［^′＼n］|＼′＼′)+＼′ (5) ＼"(［^"＼n］|＼＼［"＼n］)*＼" 3.27写出一个LEX正规式，它能匹配C语言的所有无符号整数 (例如：OX89ab，0123，45，′Z′,′＼t′,′＼xab′,′＼012′,等等) 3.28写出一个LEX正规式，它能匹配C语言的标识符 3.29编写一个LEX源程序，它将一个正文文件中的全部小写字母均换为大写字母，并将其中的制表字符、空白字符序列均用单个空格字符进行替换 (提示：在语义动作中使用全程变量yytext)。

3.30编写一个LEX源程序，它能统计一个PASCAL程序中所含用户定义之标识符个数，并能找出最长标识符中的字符个数 (提示：使用全程变量yytext及yyleng) 上机实习题对于如下文法所定义的PASCAL语言子集，试编写并上机调试一个词法分析程序：〈程序〉→〈变量说明〉BEGIN〈语句表〉END. 〈变量说明〉→VAR〈变量表〉：〈类型〉；|〈空〉〈变量表〉→〈变量表〉，〈变量〉|〈变量〉〈类型〉→INTEGER 〈语句表〉→〈语句表〉；〈语句〉|〈语句〉〈语句〉→〈赋值语句〉|〈条件语句〉|〈WHILE语句〉|〈复合语句〉|〈过程定义〉〈赋值语句〉→〈变量〉∶=〈算术表达式〉〈条件语句〉→IF〈关系表达式〉THEN〈语句〉ELSE〈语句〉〈WHILE语句〉→WHILE〈关系表达式〉DO〈语句〉〈复合语句〉→BEGIN〈语句表〉END 〈过程定义〉→PROCEDURE〈标识符〉〈参数表〉； BEGIN〈语句表〉END 〈参数表〉→(〈标识符表〉)|〈空〉〈标识符表〉→〈标识符表〉，〈标识符〉|〈标识符〉〈算术表达式〉→〈算术表达式〉+〈项〉|〈项〉〈项〉→〈项〉*〈初等量〉|〈初等量〉〈初等量〉→(〈算术表达式〉)|〈变量〉|〈无符号数〉〈关系表达式〉→〈算术表达式〉〈关系符〉〈算术表达式〉〈变量〉→〈标识符〉〈标识符〉→〈标识符〉〈字母〉|〈标识符〉〈数学〉|〈字母〉〈无符号数〉→〈无符号数〉〈数字〉|〈数字〉〈关系符〉→=|＜|＜=|＞|＞=|＜＞〈字母〉→A|B|C|…|X|Y|Z 〈数字〉→0|1|2|…|8|9 〈空〉→ 要求和提示： (1) 单词的分类。

可将所有标识符归为一类；将常数归为另一类；保留字和分隔符则可采取一词一类 (2) 符号表的建立可事先建立一保留字表，以备在识别保留字时进行查询变量名表及常数表则在词法分析过程中建立 (3) 单词串的输出形式所输出的每一单词，均按形如 (CLASS，VALUE) 的二元式编码对于变量标识符和常数，CLASS字段为相应的类别码，VALUE字段则是该标识符、常数在其符号表中登记项的序号 (要求在变量名表登记项中存放该标识符的字符串，其最大长度为四个字符；常数表登记项中则存放该整数的二进制形式)对于保留字和分隔号，由于采用一词一类的编码方式，所以仅需在二元式的CLASS字段上放置相应的单词的类别码，VALUE字段则为“空”不过，为便于查看由词法分析程序所输出的单词串，也可以在CLASS字段上直接放置单词符号串本身 (4) 可以仿照程序34的结构来编写上述词法分析程序，但其中的若干语义过程有待于具体编写 (5) 写出它的LEX源程序，并上机进行处理参考答案第三章习题解答 1．从略2．3 假设W:表示载狐狸过河，G:表示载山羊过河，C:表示载白菜过河用到的状态1：狐狸和山羊在左岸2：狐狸和白菜载左岸3:羊和白菜在左岸 4:狐狸和山羊在右岸5:狐狸和白菜在右岸 6:山羊和白菜在右岸F:全在右岸4 证明：只须证明文法G:A→αB 或A→α （A,B∈VN, α∈VT+）等价于G1:A→aB 或A→a (a∈VT+)· G1的产生式中 A→aB, 则B也有B→bC ,C→cD …. 所以有 A →abc…B’,a,b,c…∈VT,B’∈VN所以与G等价。

2）G的产生式A→αB，α∈VT+，因为α是字符串，所以肯定存在着一个终结符a，使A→aB可见两者等价，所以由此文法产生的语言是正规语言5 6 根据文法知其产生的语言是L={ambnci| m,n,i≧1}可以构造如下的文法VN={S,A,B,C}, VT={a,b,c}P={ S →aA, A→aA, A→bB, B→bB, B→cC, C→cC, C→c}其状态转换图如下:7 (1) 其对应的右线性文法是:A →0D, B→0A,B→1C,C→1|1F,C→1|0A,F→0|0E|1A,D→0B|1C,E→1C|0B(2) 最短输入串011(3) 任意接受的四个串011,0110,0011,000011(4) 任意以1打头的串.8 从略9（2）相应的3型文法(i) S →aAS→bS A→aA A→bB B→a|aB B→b|bB(ii) S→aA|a S→bB B→aB | bB A→aB A→b|bA(iii) S→aA S→bB A→bA A→aC B→aB B→bC C→a|aC C→b|bC(iv) S→bS S→aA A→aC A→bB B→aB B→bC C→a|aC C→b|bC（3）用自然语言描述输入串的特征(i) 以任意个(包括0)b开头，中间有任意个（大于1）a，跟一个b,还可以有一个由a,b组成的任意字符串(ii) 以a打头，后跟任意个（包括0）b(iii)以a打头，中间有任意个（包括0）b,再跟a,最后由一个a,b所组成的任意串结尾或者以b打头，中间有任意个（包括0）a,再跟b,最后由一个a,b所组成的任意串结尾(iv)以任意个（包括0）b开头,中间跟aa最后由一个a,b所组成的任意串结尾或者以任意个（包括0）b开头，中间跟ab后再接任意（包括0）a再接b，最后由一个a,b所组成的任意串结尾10 （1）G1的状态转换图：G2的状态转换图：(2) G1等价的左线性文法：S→Bb,S→Dd,D→C,B→Db,C→Bc,B→Ab,B→ε,A→aG2等价的右线性文法：S→dD,S→aB,D→C,B→abC,B→bB,B→bA,B→ε,C→cA,A→a（3）对G1文法,abb的推导序列是：S=>aA=>abB=>abb对G1’文法，abb的推导序列是：S=>Bb=>Abb=>abb对G2文法，aabca的推导序列是：S=>Aa=>Cca=>Babca=>aabca对G2’文法，aabca的推导序列是：S=>aB=>aabC=>aabcA=>aabca（4）对串acbd来说，G1,G1’文法都不能产生。

11将右线性文法化为左线性文法的算法：o （1）对于G中每一个形如A→aB的产生式且A是开始符，将其变为B→a,否则若A不是开始符，B→Aa; o （2）对于G中每一个形如A→a的产生式,将其变为S→Aa 12 (1)状态矩阵是：记[S]=q0 [B]=q1 [A B]=q2 [S A]=q3 ,最小化和确定化后如图（2）记 [S]=q0, [A]=q1,[B S]=q2 最小化和确定化后的状态转换图如下13 （1）将具有ε动作的NFA确定化后，其状态转换图如图：记 { S0,S1,S3}=q0 {S1}=q1 {S2 S3}=q2 {S3}=q3 (2) 记{S}=q0 {Z}=q1 {U R}=q2 {S X}=q3 {Y U R}=q4 {X S U}=q5 {Y U R Z}=q6 {Z S}=q714（1）从略(2)化简后S0和S1作为一个状态，S5和S6作为一个状态状态转换图如图15从略16从略· (1) r*表示的正规式集是{ε,r,rr,rrr,…} (ε|r)*表示的正规式集是{ε, εε,…}∪{r,rr,rrr,…}={ε,r,rr,rrr,…}ε|rr*表示的正规式集是{ε,r,rr,rrr,…}(r*)*=r*={ε,r,rr,rrr,…}所以四者是等价的。

2)（rs）*r表示的正规式集是{ε,rs,rsrs,rsrsrs,…}r ={r,rsr,rsrsr,rsrsrsr,…}r(sr)* 表示的正规式集是r{ε,sr,srsr,srsrsr,…} ={ r,rsr,rsrsr,rsrsrsr,…}所以两者等价18 写成方程组S=aT+aS(1)B=cB+c(2)T=bT+bB(3)所以B=c*cT=b*bc*cS=a*ab*bc*c· G1: S=aA+B(1) B=cC+b(2)A=abS+bB (3)C=D(4)D=bB+d(5)把（4）（5）代入（2），得B＝c(bB+d)+b=cbB+cd+b 得B=(cb)*(cd|b),代入（3）得A=abS+b(cb)*(cd|b)把它打入（1）得S=a(abS+b(cb)*(cd|b))+ (cb)*(cd|b)=aabS+ab(cb)*(cd|b) + (cb)*(cd|b)=(aab)*( ab(cb)*(cd|b)| (cb)*(cd|b))G2:S=Aa+B (1)A=Cc+Bb (2)B=Bb+a(3)C=D+Bab(4)D=d(5)可得 D=dB=ab*C=ab*ab|bA=(ab*ab|b)c + ab*bS=(ab*ab|b)ca+ab*ba +ab*=(ab*ab|b)ca| ab*ba| ab*20· 识别此语言的正规式是S=’LABEL’d(d|,d)*; · 从略。

21 从略22 构造NFA其余从略 23 下面举一个能够识别1,2,3,10,20,100的例子，读者可以推而广之{#include #include #include #define ON1#define TW 2#define THRE 3#define TE 10#define TWENT 20#define HUNDRE 100#define WHITE9999%}upper[A-Z]%%ONEreturn ON;TWOreturn TW;THREEreturn THRE;TENreturn TE;TWENTYreturn TWENT;HUNDREDreturn HUNDRE;" "+|\treturn WHITE;\nreturn0;%%main(int argc,char *argv[]){int c,i=0;char tmp[30];if (argc==2){if ((yyin=fopen(argv[1],"r"))==NULL){printf("can't open %s\n",argv[1]);exit(0);}}while ((c=yylex())!=0){switch(c){case ON:c=yylex();if (c==0) goto {i+=1;label;}c=yylex();if (c==HUNDRE)i+=100;else i+=1;break;case TW:c=yylex();c=yylex();if (c==HUNDRE)i+=200;else i+=2;break;case TWENT: i+=20;break;case TE:i+=10;break;default:break;}}/*while*/label: printf("%d\n",i);return;}24 （1）Dn表示的正规集是长度为2n任意a和b组成的字符串。

· 此正规式的长度是2n · 用来识别Dn的DFA至多需要2n＋1个状态 25 从略26（1）由{}括住的,中间由任意个非{组成的字符串, 如{},{}},{a},{defg}等等2）匹配一行仅由一个大写字母和一个数字组成的串，如A1,F8,Z2等3）识别\r\n和除数字字符外的任何字符· 由’和’括住的，中间由两个’’或者非’和\n组成的任意次的字符串如’’’’, ‘a’,’bb’,’def’，’’’’’’等等 27O[Xx][0-9]*[a-fA-F]*|[0-9]+|(\’([a-zA-Z]|\\[Xx][0-7][0-7a-fA-F]|\\0[01][0-7][0-7]|\\[a-z])\’)28^[a-zA-Z_]+[0-9]*[a-zA-Z_]*29 参考程序如下：%{#include #include #include #define UPPER2#define WHITE3%}upper[A-Z]%%{upper}+returnUPPER;\t|" "+returnWHITE;%%main(int argc,char *argv[]){int c,i;if (argc==2){if ((yyin=fopen(argv[1],"r"))==NULL){printf("can't open %s\n",argv[1]);exit(0);}} while ((c=yylex())!=EOF){if (c==2){for (i=0;yytext[i];i++)printf("%c",tolower(yytext[i]));yytext[0]='\000';}if (c==3)printf(" ");else printf("%s",yytext);}return;}yywrap(){return ;}30 从略。

第四章语法分析和语法分析程序 4.1消除下列文法的左递归性 (1) S→SAS→A A→SBA→B A→(S)A→( ) B→［S］B→［］ (2) S→ASS→b A→SAA→a (3) S→(T)S→a S→εT→S T→T,S 4.2设已给文法： S→AbBS→d A→CAbA→Bf B→CSdB→d C→edC→a 试写出对符号串eddfbbd进行带回溯的自顶向下语法分析的过程 4.3对于如下的文法，用某种高级语言写出递归下降分析程序 (1) P→begin d; X end X→d;X X→sY Y→;sY Y→ε (2) 〈程序〉→begin〈语句〉end 〈语句〉→〈赋值语句〉|〈条件语句〉〈赋值语句〉→〈变量〉∶=〈表达式〉〈条件语句〉→if〈表达式〉then〈语句〉〈表达式〉→〈变量〉〈表达式〉→〈表达式〉+〈变量〉〈变量〉→i 4.4对于如下的文法，求出各个FIRST集和FOLLOW集 S→aABS→bA S→εA→aAb A→εB→bB B→ε 4.5试证明：任何具有左递归性的前后文无关文法均非LL(1)文法 4.6试证明：任何LL(1)文法均为无二义性文法。

4.7验证下列文法是否为LL(1)文法 (1)S→ABS→CDa A→abA→c B→dEC→eC C→εD→fD D→fE→dE E→ε (2) S→aABbCDS→ε A→ASdA→ε B→SAcB→eC B→εC→Sf C→CgC→ε D→aBDD→ε 4.8对于如下的文法G［S］： S→SbS→Ab S→bA→Aa A→a (1) 构造一个与G等价的LL(1)文法G′； (2) 对于G′，构造相应的LL(1)分析表 49设已给文法 S→SaBS→bB A→SA→a B→Ac (1) 求出各个FIRST集和FOLLOW集； (2) 将它改写为LL(1)文法 410将下面的文法改写为LL(1)文法 (1) 〈布尔表达式〉→〈布尔表达式〉∨〈布尔因子〉〈布尔表达式〉→〈布尔因子〉〈布尔因子〉→〈布尔因子〉∧〈布尔二次量〉〈布尔因子〉→〈布尔二次量〉〈布尔二次量〉→〈布尔初等量〉〈布尔二次量〉→〈布尔初等量〉〈布尔初等量〉→(〈布尔表达式〉) 〈布尔初等量〉→true | false (2) 习题26中所给的文法 411设G［S］为LL(1)文法，A为G的非终结符号，A+ε，且由A至少可推出一个非ε的终结符号串，试证明： G中不会含有形如 B→αAAβ 的产生式，其中α，β∈(VT∪VN)*。

412试找出下列文法的全部简单优先关系，并指出它们是否为简单优先文法： (1) S→(AS)S→b A→(SaA)A→a (2) S→(R)S→∧ S→aR→T T→S,TT→S (3) S→(SRS→a R→,SRR→) (4) S→#Z#Z→E Z→E+TZ→T Z→iT→(Z) T→i 413对于文法G［S］： S→A/A→Aa A→ASA→/ (1) 构造G［S］的简单优先矩阵； (2) 找出其中的多重定义元素，以验证G［S］不是简单优先文法 414试用某种高级语言编写一个求出给定文法的全部简单优先关系的程序，此程序以某种适当形式表示的文法为输入 415试证明如下的句柄定理，即证明简单优先文法的任何句型X1X2…Xn的句柄是满足如下关系： Xi-1＜·Xi Xi=·Xi+1=·…=·Xi+k Xi+k＞·Xi+k+1 的最左子串XiXi+1…Xi+k 416对于如下的文法G［〈变量说明〉］：〈变量说明〉→VAR〈变量表〉：〈类型〉；〈变量表〉→〈变量表〉，〈变量〉|〈变量〉〈变量〉→i 〈类型〉→real|integer|boolean|char (1) 将G改造为等价的简单优先文法G′； (2) 求出G′的全部简单优先关系。

417试证明，任何算符文法不会有两个非终结符号相邻的句型 418试证明，若G不是算符文法，则G至少有一个句型包含相邻的非终结符号 419试构造这样的产生“简单算术表达式”的文法此种表达式可含有+、-、*、/、↑等运算符，且以简单变量 (用变量标识符表示)作为运算对象，而上述运算符的优先顺序从高到低排列如下： +,- *,/ ↑ 其中，排列在同一行的运算符有相同的优先级，同级的运算符服从右结合规则 420对于算符文法G［S］： S→EE→E-T E→TT→T*F T→FF→-P F→PP→(E) P→i (1) 构造G的算符优先矩阵； (2) 指出G不是算符优先文法，即指出具有多重定义的优先矩阵元素； (3) 将G改写为算符优先文法 421设G是一算符文法试证明，在G的句型中，不含紧跟于非终结符号之后或直接居于非终结符号之前的短语，即证明如下两论断成立： (1) 若 α=…Ua…a∈VT, U∈VN 是G的一个句型，则α中任何含有a的短语也必包含U； (2) 若 α=…aU…a∈VT, U∈VN 是G的一个句型，则α中任何含有a的短语也必包含U 422设G是算符文法，a,b∈VT,U∈VN，试证明： (1) 若α=…aU…为G的句型，且U+b…，则有a○＜ b； (2) 若α=…Ub…为G的句型，且U+…a，则有a○＞ b。

423设G为算符文法，α=…aUb…或α=…ab…是G的一个句型 (a,b∈VT,U∈VN)，则算符优先关系a○＜ b，a○= b或a○＞ b至少有一个成立 424设G为算符文法，α是G中至少含有一个终结符号的句型，试证明，在符号串#α#中，必含有一个形如aβc的子串，使如下的关系成立： a○＜ b1○= b2○= … bn○＞ cn≥1 其中，a,c∈VT∪{#}，而bi为β中的终结符号 425设G为算符优先文法，α=…aUb…或α=…ab…是G的一个句型 (a,b∈VT,U∈VN)，试证明，关系a○＜ b,a○= b或a○＞ b之中，必有且仅有一个成立 426设G为算符优先文法,α=…aUb…或α=…ab…是G的一个句型 (a,b∈VT,U∈VN)，试证明： (1) 若a○＜ b，则α中必有一个含有b但不包含a的短语； (2) 若a○= b，则α中每个含有a的短语也必包含b，反之亦然； (3) 若a○＞ b，则α中必有一个含有a但不包含b的短语 427设G为算符优先文法，u。

点击阅读更多内容