1、先读入终结符,非终结符,和所有产生式。





2、预处理:初始化;getpp()获得每个非终结符在产生式左边时的产生式编号,

记录在 string getp[]中(可以多个)。





3.获得所有的符号的first集:dfs法,从S开始DFS,遇到终结符则是递归出口,回溯时候沿路保存记录所有路径上VN的first,(遇到有左递归的,continue,左递归的产生式不用不影响求fisrt集)





4:获得项目集族:一个lr(1)项目用一个结构体记录,get_close(项目 t):bfs来完成对t的闭包。getxmjizu():bfs,并用链式前向星记录图。





5.获得分析表table[][]:遍历对于图的所有边,状态i->j有权为w的边,置action(i,w)=j;go,本质是一样的.其次扫描所有项目,对于归约项目,置归约

6总控程序:俩个栈:状态栈和符号栈,无非移进、归约,接受保存。

测试:

a b

H S B

H->S

B->aB

S->BB

B->b

end





i * ( ) +

E T F

E->E+T

E->T

T->T*F

T->F

F->(E)

F->i

end





a b c d

S A B

S->A

A->B|cAd

B->aBb|ab

end

#include<iostream>
#include<string>
#include<map>
#include<vector>
#include<stack>
#include<set>
#include<cstring>
#include<queue>
using namespace std;
map<char,int>getnum;
char getchar[100]; //获得对应字符
vector<string>proce; //产生式
int table[30][30]; //预测分析表 -1
int tb_s_r[30][30]; //是移进项还是规约项,-1,-2.
int num=0;int numvt=0; //numvt是终结符集合,0是‘#’,numvt表空字
void readin() //读入vt,vn,编号1-num,读入所有产生式
{
memset(table,-1,sizeof(table));
getnum['#']=0;
getchar[0]='#';
cout<<"请输入终结符集:"<<endl;
char x;
do
{
cin>>x;
getnum[x]=++num;
getchar[num]=x;
}while(cin.peek()!='\n');
numvt=++num;
getnum['@']=numvt; //kong zi
getchar[num]=('@');
cout<<"请输入非终结符集:"<<endl;
do
{
cin>>x;
getnum[x]=++num;
getchar[num]=x;
}while(cin.peek()!='\n');
cout<<"输入所有产生式(空字用‘@’表示),以‘end’结束:"<<endl;
string pro;
while(cin>>pro&&pro!="end")
{
string ss;
ss+=pro[0];
for(int i=3;i<pro.size();i++)
{
if(pro[i]=='|')
{
proce.push_back(ss);
ss.clear();ss+=pro[0];
}
else
{
ss+=pro[i];
}
}
proce.push_back(ss);
}
}
struct xiangmu //一个项目
{
int nump; //产生式编号
int id; //.的位置
string fst; //集合
};
string getp[100]; //获得某终结符在左边的产生式集合
void getpp()
{
for(int i=0;i<proce.size();i++)
{
int temp=getnum[proce[i][0]];
getp[temp]+=char('0'+i);
}
}
string first[100]; //每个符号的first集
bool gotfirst[100]; //是否已经完成FIRST集合
void dfsgetfirst(int nv,int nump) //当前的符号,和对应产生式编号
{
int temp=getnum[proce[nump][1]]; //产生式推出来的首符
gotfirst[nump]=1; //标记
if(temp<=numvt)first[nv]+=char('0'+temp); //是终结符
else
{
for(int i=0;i<getp[temp].size();i++) //所有temp可以推出来的符号对应的产生式
{
if(proce[nump][0]==proce[nump][1])continue; //左递归的产生式不用不影响求fisrt集
dfsgetfirst(temp,getp[temp][i]-'0');
} first[nv]+=first[temp]; //回溯时候沿途保存
}
}
void get_first()
{
for(int i=1;i<=numvt;i++) // 终结符first集合是它自己.
{
first[i]=char('0'+i);
}
for(int i=0;i<proce.size();i++)
{
if(proce[i][0]==proce[i][1])continue; //左递归的产生式不用不影响求fisrt集
if(gotfirst[i])continue; //已经生成。
int temp=getnum[proce[i][0]];
dfsgetfirst(temp,i);
}
}
vector<vector<xiangmu> >v; //项目集族
int e[100][3]; int head[100];int nume=0; //链式前向星项目集族图
void addegde(int from,int to,int w) //添加边
{
e[nume][0]=to;e[nume][1]=head[from];head[from]=nume;
e[nume++][2]=w;
}
void clear() //初始化函数
{
for(int i=0;i<100;i++)
head[i]=-1;
for(int i=0;i<30;i++)
for(int j=0;j<30;j++)
tb_s_r[i][j]=table[i][j]=-1;
nume=0;
}
inline bool xmeq(xiangmu a,xiangmu b)
{
if(a.fst==b.fst&&a.id==b.id&&a.nump==b.nump)return 1;
return 0;
}
bool isin(xiangmu a,vector<xiangmu> b) //xm a is in xmji b
{
for(int i=0;i<b.size();i++)
{
if(xmeq(a,b[i]))return 1;
}
return 0;
}
vector<xiangmu> hebing(vector<xiangmu>a ,vector<xiangmu>b) //合并项目集 a,b 复给 a
{
for(int i=0;i<b.size();i++)
{
if(isin(b[i],a))continue;
else
a.push_back(b[i]);
}
return a;
}
bool xmjieq(vector<xiangmu> a,vector<xiangmu> b) //两个项目集是否相等
{
if(a.size()!=b.size())return 0;
for(int i=0;i<a.size();i++)
{
if(!isin(a[i],b))return 0;
}
return 1;
}
int xmji_isin_xmjizu(vector<xiangmu>a,vector<vector<xiangmu> >b) //查找项目集,若有,则返回编号,一举俩得
{
for(int i=0;i<b.size();i++)
{
if(xmjieq(a,b[i]))return i;
}
return -1;
}
vector<xiangmu> get_close(xiangmu t) //对项目 T作闭包
{
vector<xiangmu> temp;
temp.push_back(t);
queue<xiangmu> q; //bfs完成闭包
q.push(t);
while(!q.empty())
{
xiangmu cur=q.front();
q.pop();
if(cur.id==proce[cur.nump].size()) //归约项舍去
continue;
int tt=getnum[proce[cur.nump][cur.id]]; //tt is thm num of '.'zhihoudefuhao
if(tt<=numvt) continue ; //若是终结符,则不必找了
for(int i=0;i<getp[tt].size();i++) //对应产生式的编号
{
xiangmu c;
c.id=1; //
c.nump=getp[tt][i]-'0'; //
if(proce[cur.nump].size()-cur.id==1) // the last : A->BC.D,a/b
c.fst+=cur.fst;
else //not the last :A->B.CFb,a/b
{
int tttnum=getnum[proce[cur.nump][cur.id+1]];
c.fst+=first[tttnum];
}
if(!isin(c,temp)) //排重,新的项目就加入。
{
q.push(c);
temp.push_back(c);
}
}
}
return temp;
}
void get_xiangmujizu() //获得项目集族
{
vector<xiangmu>temp;
xiangmu t;
t.nump=0;t.id=1;t.fst+='0'; //初始的项目集:0
temp=get_close(t);
queue<vector<xiangmu> >q; //bfs法获得
q.push(temp);
v.push_back(temp); //第一个入
while(!q.empty())
{
vector<xiangmu> cur=q.front();
q.pop();
for(int i=1;i<=num;i++) //所有符号
{
if(i==numvt)continue; //'#'
vector<xiangmu> temp;
for(int j=0;j<cur.size();j++) //该项目集中的所有项目
{
if(cur[j].id==proce[cur[j].nump].size())continue; //是规约项目,无法再读入了
int tt=getnum[proce[cur[j].nump][cur[j].id]];
if(tt==i) //can read in 符号i
{
xiangmu tempt;
tempt.fst=cur[j].fst;
tempt.id=cur[j].id+1;
tempt.nump=cur[j].nump;
temp=hebing(temp,get_close(tempt));
}
}
if(temp.size()==0)continue; //该符号无法读入。
int numcur=xmji_isin_xmjizu(cur,v); //当前节点标号
int tttnum=xmji_isin_xmjizu(temp,v); //新目标标号
if(tttnum==-1) //新的项目集
{
v.push_back(temp);
q.push(temp);
addegde(numcur,v.size()-1,i) ; //添加边,权为读入的符号
}
else //老的项目集
{
addegde(numcur,tttnum,i);
}
}
}
}
void print_xmjizu() //打印项目集族
{
for(int i=0;i<v.size();i++)
{
cout<<"项目集"<<i<<":"<<endl;
for(int j=0;j<v[i].size();j++)
{
cout<<proce[v[i][j].nump]<<" "<<v[i][j].id<<" "<<v[i][j].fst<<endl;
}
cout<<endl;
}
for(int i=0;i<v.size();i++)
{
for(int j=head[i];j!=-1;j=e[j][1])
{
cout<<" "<<getchar[e[j][2]]<<endl;
cout<<i<<"--->"<<e[j][0]<<endl;
}
}
}
bool get_table() //获得分析表table[i][j]=w:状态i-->j,读入符号W。
{
for(int i=0;i<v.size();i++) //遍历图
{
for(int j=head[i];j!=-1;j=e[j][1])
{
if(table[i][e[j][2]]!=-1)return 0; //多重入口,报错.
table[i][e[j][2]]=e[j][0];
tb_s_r[i][e[j][2]]=-1; //移近项-1。
}
}
for(int i=0;i<v.size();i++) //遍历所有项目
{
for(int j=0;j<v[i].size();j++)
{
if(v[i][j].id==proce[v[i][j].nump].size()) //归约项
{
for(int k=0;k<v[i][j].fst.size();k++)
{
if(table[i][(v[i][j].fst)[k]-'0']!=-1)return 0; //多重入口,报错.
if( (v[i][j].fst)[k]=='0'&&v[i][j].nump==0)
table[i][(v[i][j].fst)[k]-'0']=-3 ; //接受态。
else
{
table[i][(v[i][j].fst)[k]-'0']=v[i][j].nump;
tb_s_r[i][(v[i][j].fst)[k]-'0']=-2; //归约态
}
}
}
}
}
return 1;
}
void print_table()
{
cout<<"LR(1)分析表:"<<endl;
cout<<"状态 "<<" actoin "<<endl;
for(int j=0;j<=num;j++)
{
if(j==numvt)continue;
cout<<" "<<getchar[j];
}
cout<<endl;
for(int i=0;i<v.size();i++)
{
cout<<i<<" ";
for(int j=0;j<=num;j++)
{
if(j==numvt)continue;
if(table[i][j]==-3) cout<<"acc"<<" "; //接受
else if(table[i][j]==-1)cout<<" "; //空
else if(tb_s_r[i][j]==-1)cout<<"s"<<table[i][j]<<" "; //移近
else if(tb_s_r[i][j]==-2)cout<<"r"<<table[i][j]<<" "; //归约
}
cout<<endl;
}
}
string word;
void print_now_state(int count,stack<int>state,stack<int>wd,int i)
{
cout<<count<<'\t'<<'\t';
stack<int>temp;
while(!state.empty())
{
temp.push(state.top());
state.pop();
}
while(!temp.empty())
{
cout<<temp.top();
temp.pop();
}
cout<<'\t'<<'\t';
while(!wd.empty())
{
temp.push(wd.top());
wd.pop();
}
while(!temp.empty())
{
cout<<getchar[temp.top()];
temp.pop();
}
cout<<'\t'<<'\t';
for(int j=i;j<word.size();j++)
cout<<word[j];
cout<<'\t'<<'\t';
}
bool analyze()
{
cout<<" "<<word<<"的分析过程:"<<endl;
cout<<"步骤\t\t"<<"状态栈\t\t"<<"符号栈\t\t"<<"输入串\t\t"<<"动作说明"<<endl;
stack<int>state; //俩个栈:状态栈和符号栈
stack<int>wd;
int count=0;
state.push(0); //初始化
wd.push(0); //'#'
for(int i=0;;) //i,读入文本的
{
int cur=state.top();
if(table[cur][getnum[word[i]]]==-1) // 空白,报错误
return 0;
if(table[cur][getnum[word[i]]]==-3) //接受态
{
print_now_state(count++,state,wd,i);
cout<<" 恭喜!acc!"<<endl;
return 1;
}
if(tb_s_r[cur][getnum[word[i]]]==-1) //移进项
{
print_now_state(count++,state,wd,i);
int newstate=table[cur][getnum[word[i]]];
cout<<"action["<<cur<<","<<getnum[word[i]]<<"]="<<newstate;
cout<<",状态"<<newstate<<"入栈"<<endl;
wd.push(getnum[word[i]]);
state.push(newstate);
i++;
}
else if(tb_s_r[cur][getnum[word[i]]]==-2) //归约
{
print_now_state(count++,state,wd,i); int numpro=table[cur][getnum[word[i]]]; //用该产生式归约
int len=proce[numpro].size()-1;
for(int ii=0;ii<len;ii++) //弹栈
{
wd.pop();
state.pop();
}
wd.push(getnum[proce[numpro][0]]); //新入
int cur=state.top();
cout<<"用"<<proce[numpro][0]<<"->";
for(int ii=1;ii<=len;ii++)
cout<<proce[numpro][ii];
cout<<"进行归约,"<<"goto["<<cur<<","<<getnum[word[i]]<<"]="<<table[cur][getnum[proce[numpro][0]]];
cout<<"入栈"<<endl;
state.push(table[cur][getnum[proce[numpro][0]]]);
}
}
return 1;
}
int main()
{
clear();
readin();
getpp();
get_first();
get_xiangmujizu();
if(!get_table())
{
cout<<"此文法在生成分析表时候有多重入口,非LR(1)文法!"<<endl;
return 0;
}
// print_xmjizu();
print_table();
cout<<"请输入字:"<<endl;
cin>>word;
word+='#';
if(!analyze())
cout<<"error!"<<endl;
else;
return 0;
}

LR(1)文法分析器 //c++ 实现的更多相关文章

  1. LR(1)语法分析器生成器(生成Action表和Goto表)java实现(二)

    本来这次想好好写一下博客的...结果耐心有限,又想着烂尾总比断更好些.于是还是把后续代码贴上.不过后续代码是继续贴在BNF容器里面的...可能会显得有些臃肿.但目前管不了那么多了.先贴上来吧hhh.说 ...

  2. LR(1)语法分析器生成器(生成Action表和Goto表)java实现(一)

    序言 : 在看过<自己实现编译器链接器>源码之后,最近在看<编译器设计>,但感觉伪代码还是有点太浮空.没有掌握的感觉,也因为内网几乎没有LR(1)语法分析器生成器的内容,于是我 ...

  3. LR(0)文法项目集规范族、DFA和分析表的构建实例

    最近在复习编译原理,考试之前以为自己懂了,眼高手低就没去实践.结果一考试出问题了.... 学习就要脚踏实地,容不得半点模糊.凭着侥幸心理很危险的.以后要引以为戒啊. 特别写出这篇文章 :一来总结一下这 ...

  4. Yacc - 一个生成 LALR(1) 文法分析器的程序

    SYNOPSIS 总览 yacc [ -dlrtv ] [ -b file_prefix ] [ -p symbol_prefix ] filename DESCRIPTION 描述 Yacc 从 f ...

  5. 求LR(0)文法的规范族集和ACTION表、GOTO表的构造算法

    原理 数据结构 // GO private static Map<Map<Integer,String>,Integer> GO = new HashMap<Map< ...

  6. C# 语法分析器(二)LR(0) 语法分析

    系列导航 (一)语法分析介绍 (二)LR(0) 语法分析 (三)LALR 语法分析 (四)二义性文法 (五)错误恢复 (六)构造语法分析器 首先,需要介绍下 LALR 语法分析的基础:LR(0) 语法 ...

  7. 基于Predictive Parsing的ABNF语法分析器(十)——AbnfParser文法解析器之数值类型(num-val)

    ANBF语法中的数值类型有3种:二进制.十进制和十六进制,可以是一个以点号分隔的数列,也可以是一个数值的范围.例如,%d11.22.33.44.55表示五个有次序的十进制数字“11.22.33.44. ...

  8. 【编译原理】自底向上分析方法——LR文法分析方法的总结

    LR(0).SLR(1).LR(1).LALR(1) de 若干方面的区别 目录 推导过程 分析能力 本质区别 文法对比 可以适当利用物理意义对二义性文法进行冲突处理 推导过程 LR(0)的基础上才有 ...

  9. 编译原理--02 自顶向下、自底向上的LR分析复习(清华大学出版社第3版)

    前言 目录 01 文法和语言.词法分析复习 02 自顶向下.自底向上的LR分析复习 03 语法制导翻译和中间代码生成复习 04 符号表.运行时存储组织和代码优化复习 第4章 自顶向下的语法分析方法 确 ...

随机推荐

  1. Catalan 数

    概要 在一些面试的智力题中会遇到此数的变形,如果完全不了解,直接想结果是很困难的,故在此简单介绍一下.   基本定义 Catalan 数的定义根据不同的应用环境有很多不同的定义方式,下面给出一个.   ...

  2. Python 输入输出 数据类型 变量

    python输入输出 数据类型 变量 输入输出 print()在Python3中是函数 >>>print('hello world') #print注意print前面不要有任何空格 ...

  3. VC-基础:关于一些符号的意义

    GUI应用程序:Graphic User Interface图形 用户 接口 SDI:单文档程序(典型的记事本就是SDI) MID:多文档程序(比如VS2008默认就是多文档的)

  4. CPP-基础:关于引用

    1.什么是“引用”?申明和使用“引用”要注意哪些问题? 引用就是某个目标变量的“别名”(alias),对应用的操作与对变量直接操作效果完全相同. 申明一个引用的时候,切记要对其进行初始化. 引用声明完 ...

  5. 导出Excel插件——Export-CSV ---20150610

    出处:http://bbs.hcharts.cn/thread-99-1-1.html   导出Excel插件——Export-CSV 一.插件信息 插件名:Export-CSV(导出Execl文件) ...

  6. TortoiseSVN文件夹及文件图标不显示解决方法---20150515

    由于自己的电脑是win7(64位)的,系统安装TortoiseSVN之后,其他的功能都能正常的使用,但是就是文件夹或文件夹的左下角就是不显示图标,这个问题前一段时间就遇到了(那个时候没找到合适的答案) ...

  7. JS数组专题2️⃣ ➖ 数组去重

    距离上次发文,已经有一段时间了,最近工作比较忙,这不眼看快双十一了,就相当于给大家一些福利吧! 一.什么是数组去重 简单说就是把数组中重复的项删除掉,你 GET 到了吗 ?下面我将简单介绍下几种基本的 ...

  8. 关于HTML设置访问密码。

    如果你要设置访问密码恐怕要使用sublime_text了 废话不多,开始!!! 先把这些东西加上: <html> <script> 然后开始写代码: 先辨别密码登录正确的情况: ...

  9. centOS下SVN安装和配置

    1>SVN服务器端文件可见问题 在平时使用SVN时候,一直以为在客户提交文件,那么在服务器对应的版本库下面就会有相同文件.在自己搭建后,发现提交到服务器端文件完全看不见.... 这是由于SVN服 ...

  10. 破解点触码的识别之第三方平台超级鹰的SDK(python3版本)

    import requestsfrom hashlib import md5 class Chaojiying(object): def __init__(self, username, passwo ...