实验一、词法分析器(含源代码)

实验一、词法分析器(含源代码)


2024年5月22日发(作者:)

词法分析器实验报告

一、 实验目的及要求

本次实验通过用C语言 设计、编制、调试一个词法分析子程序,识别单词,实现一

个C语言词法分析器,经过此过程可以加深对编译器解析单词流的过程的了解。

运行环境:

硬件:windows xp

软件:visual c++6.0

二、实验步骤

1.查询资料,了解词法分析器的工作过程与原理。

2.分析题目,整理出基本设计思路。

3.实践编码,将设计思想转换用c语言编码实现,编译运行。

4.测试功能,多次设置包含不同字符,关键字的待解析文件,仔细察看运行结果,检

测该分析器的分析结果是否正确。通过最终的测试发现问题,逐渐完善代码中设置的分析

对象与关键字表,拓宽分析范围提高分析能力。

三、 实验内容

本实验中将c语言单词符号分成了四类:关键字key(特别的将main说明为主函数)、

普通标示符、常数和界符。将关键字初始化在一个字符型指针数组*key[]中,将界符分别

由程序中的case列出。在词法分析过程中,关键字表和case列出的界符的内容是固定不

变的(由程序中的初始化确定),因此,从源文件字符串中识别出现的关键字,界符只能从

其中选取。标识符、常数是在分析过程中不断形成的。

对于一个具体源程序而言,在扫描字符串时识别出一个单词,若这个单词的类型是关

键字、普通标示符、常数或界符中之一,那么就将此单词以文字说明的形式输出.每次调

用词法分析程序,它均能自动继续扫描下去,形成下一个单词,直到整个源程序全部扫描

完毕,从而形成相应的单词串。

输出形式例如:void $关键字

流程图 、程序

流程图:

开始

输入源文

件路径

路径是否有

打开源文件

初始化文件指针

识别指针内容

文件结束?

是空格,空白或换

行吗

跳过该字符

是结束

否是字母吗

将字符加入字符数

组Word[]

否是数字吗否是界符吗否

将字符加入字符数

组Word[]

将字符加

入字符数

组Word[]

指向下一字符

识别指针内容

输出word

为界符

输出Word

内容为不

可识别

将字符

加入字

符数组

Word[]

将字符

加入字

符数组

Word[]

指向下一字符指向下一字符

是字母惑数字

回退

将word与关键

字表key进行匹

输出word为

普通标示符

是数字吗

输出word

为常数

指向下一字符

匹配?

输出word

为关键字

程序:

#include

#include

#include

#include

//定义关键字

char *Key[10]={"main","void","int","char","printf","scanf","else","if","return"};

char Word[20],ch; // 存储识别出的单词流

int IsAlpha(char c) { //判断是否为字母

if(((c<='z')&&(c>='a'))||((c<='Z')&&(c>='A'))) return 1;

else return 0;

}

int IsNum(char c){ //判断是否为数字

if(c>='0'&&c<='9') return 1;

else return 0;

}

int IsKey(char *Word){ //识别关键字函数

int m,i;

for(i=0;i<9;i++){

if((m=strcmp(Word,Key[i]))==0)

{

if(i==0)

return 2;

return 1;

}

}

return 0;

}

void scanner(FILE *fp){ //扫描函数

char Word[20]={'0'};

char ch;

int i,c;

ch=fgetc(fp); //获取字符,指针fp并自动指向下一个字符

if(IsAlpha(ch)){ //判断该字符是否是字母

Word[0]=ch;

ch=fgetc(fp);

i=1;

while(IsNum(ch)||IsAlpha(ch)){ //判断该字符是否是字母或数字

Word[i]=ch;

i++;

ch=fgetc(fp);

}

Word[i]='0'; //'0' 代表字符结束(空格)

fseek(fp,-1,1); //回退一个字符

c=IsKey(Word); //判断是否是关键字

if(c==0) printf("%st$普通标识符nn",Word);//不是关键字

else if(c==2) printf("%st$主函数nn",Word);

else printf("%st$关键字nn",Word); //输出关键字

}

else //开始判断的字符不是字母

if(IsNum(ch)){ //判断是否是数字

Word[0]=ch;

ch=fgetc(fp);

i=1;

while(IsNum(ch)){

Word[i]=ch;

i++;

ch=fgetc(fp);

}

Word[i]='0';

fseek(fp,-1,1); //回退

printf("%st$无符号实数nn",Word);

}

else //开始判断的字符不是字母也不是数字

{

Word[0]=ch;

switch(ch){

case'[':

case']':

case'(':

case')':

case'{':

case'}':

case',':

case'"':

case';':printf("%st$界符nn",Word); break;

case'+':ch=fgetc(fp);

Word[1]=ch;

if(ch=='='){

printf("%st$运算符nn",Word);//运算符“+=”

}

else if(ch=='+'){

printf("%st$运算符nn",Word); //判断结果为“++”

}

else {

fseek(fp,-1,1);

printf("%st$运算符nn",Word); //判断结果为“+”

}

break;

case'-':ch=fgetc(fp);

Word[1]=ch;

if(ch=='='){

printf("%st$运算符nn",Word); }

else if(ch=='-'){

printf("%st$运算符nn",Word); //判断结果为“--”

}

else {

fseek(fp,-1,1);

printf("%st$运算符nn",Word); //判断结果为“-”

}

break;

case'*':

case'/':

case'!':

case'=':ch=fgetc(fp);

if(ch=='='){

printf("%st$运算符nn",Word);

}

else {

fseek(fp,-1,1);

printf("%st$运算符nn",Word);

}

break;

case'<':ch=fgetc(fp);

Word[1]=ch;

if(ch=='='){

printf("%st$运算符nn",Word); //判断结果为运算符“<=”

}

else if(ch=='<'){

printf("%st$运算符nn",Word); //判断结果为“<<”

}

else {

fseek(fp,-1,1);

printf("%st$运算符nn",Word); //判断结果为“<”

}

break;

case'>':ch=fgetc(fp);

Word[1]=ch;

if(ch=='=') printf("%st$运算符nn",Word);

else {

fseek(fp,-1,1);

printf("%st$运算符nn",Word);

}

break;

case'%':ch=fgetc(fp);

Word[1]=ch;

if(ch=='='){printf("%st$运算符nn",Word);}

if(IsAlpha(ch)) printf("%st$类型标识符nn",Word);

else {

fseek(fp,-1,1);

printf("%st$取余运算符nn",Word);

}

break;

default:printf("无法识别字符!nn"); break;

}

}

}

main()

{

char in_fn[30]; //文件路径

FILE *fp;

printf("n请输入源文件名(包括路径和后缀名):");

while(1){

gets(in_fn);

//scanf("%s",in_fn);

if((fp=fopen(in_fn,"r"))!=NULL) break; //读取文件内容,并返回文件指针,该指

针指向文件的第一个字符

else printf("文件路径错误!请重新输入:");

}

printf("n******************* 词法分析结果如下 *******************n");

do{

ch=fgetc(fp);

if(ch=='#') break; //文件以#结尾,作为扫描结束条件

else if(ch==' '||ch=='t'||ch=='n'){} //忽略空格,空白,和换行

else{

fseek(fp,-1,1); //回退一个字节开始识别单词流

scanner(fp);

}

}while(ch!='#');

return(0);

}

4.实验结果

解析源文件:

void main()

{

int a=3;

a+=b;

printf("%d",a);

return;

}

#

解析结果:

5.实验总结分析

通过本次实验,让再次浏览了有关c语言的一些基本知识,特别是对文件,字符串进

行基本操作的方法。C语言中没有string类型,因此本实验中的对字符串提取与识别均借

助#include及字符型数组来实现。让我练习对字符串函数应用的同时也提高了

自己的逻辑思维能力。

在本次实验中,我纠正了一个一直以来的概念错误:main不是关键字,它定义为程

序的入口,是主函数!在本实验中,虽然我把main初始化在关键字表

(字符指针类型数组)*Key[10]中,当与该数组中字符串进行比较时,若与main匹

配成功,则返回2,若为其他关键字则返回1,以此来把main从关键字中区别出来。

在本实验中的关键字表只初始化了几个常用的关键字,还可继续扩充(只需扩大数组,

向其中补充要添加的关键字)。

如果要对本程序中未识别的c语言中的一些其他的字符进行扩充(目前处理为不可识

别字符),可在程序代码中继续添加case选项,分别对相应要识别的特殊字符加以描述


发布者:admin,转转请注明出处:http://www.yc00.com/web/1716363850a2727505.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信