词法分析实验报告 实验目的:用c 语言对一个简单语言的子集编制一个一遍扫描的编译程序,以加深对编译原理的理解,掌握编译程序的实现方法和技术。 c.1 词法分析 c.1.1 实验目的 设计、编制并调试一个词法分析程序,加深对词法分析原理的理解。 c.1.2 实验要求 c.1.2.1 待分析的简单语言的词法 (1) 关键字: begin if then while do end 所有关键字都是小写。 (2)运算符和界符: : = + - * / < > <= <> >= ; ( ) # (3):其他单词是标识符(ID)和整型常数(NUM),通过以下正规式定义: ID=letter(letter | digit)* NUM=digit digit* (4)空格由空白、制表符和换行符组成。空格一般用来分隔 ID、NUM、运算符、界符和关键字,词法分析阶段通常被忽略。 C.1.2.2 各种单词符号对应的种别码 单词符号 种别码 单词符号 种别码 Begin 1 : 17 If 2 := 18 Then 3 < 20 While 4 <> 21 Do 5 <= 22 End 6 > 23 Letter(letter+digit)* 10 >= 24 Digit digit* 11 = 25 + 13 : 26 - 14 ( 27 * 15 ) 28 / 16 # 0 C.1.2.3 词法分析程序的功能 输入:所给文法的源程序字符串。 输出:二元组(syn,token 或 num)构成的序列。 其中:syn 为单词种别码; token 为存放的单词自身字符串; sum 为整型常数。 例如:对源程序 begin x:=9; if x>0 then x:=2*x+1/3;end # 的源文件,经词法分析后输出如下序列: (1,begin)(10,’x’)(18,:=)(11,9)(29,;)(2,if)… C 1.3 词法分析程序的算法思想 算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。 1. 主程序示意图 主程序示意图如图 C.1 所示。其中初值包括如下两个方面: (1) 关键字表的初值。 关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符,查关键字表。如能查到匹配的单词,则该单词的关键字,否则为一般标识符。关键表为一个字符串数组,其描述如下: char *rwtab[6]=”begin”,”if”,”then”,”while”,”do”,”end”} ; (2) 程序中需要用到的主要变量为syn,token 和 sum. 2.扫描子程序的算法思想 首先设置 3 个变量:(1)token 用来存放构成单词符号的字符串;(2)sum 用来存放整型单词;(3)s...