什么是自顶向下分析法

在语法分析过程中一般有两种语法分析方法，自顶向下和自底向上，递归下降分析和LL(1)都属于是自顶向下的语法分析

自顶向下分析法的过程就像从第一个非终结符作为根节点开始根据产生式进行树的构建

S -> AB
A -> Cb | c
B -> f
C -> de

对输入字符串debf的分析过程

S -> CbB -> debf
S -> cf   x

整个过程就是对通过非终结符的不断替换，所以当我们从左往右匹配这个句子的时候，需要找到合适的产生式，所以在自顶向下语法分析过程中作出正确的推导有两种方法，一是递归下降，二是表驱动的语法分析，也就是LL(1)

递归下降

对于递归下降分析，每个非终结符都有一个对应的函数，程序从开始符号的对应函数开始执行，如果程序成功扫描了整个输入字符串，就代表语法分析成功

在调用非终结符对应的函数时就会遇见两种情况：

遇到终结符，因为终结符本质上是token，所以直接把这个终结符和句子中对应位置的token进行比较，判断是否符合即可；符合就继续，不符合就返回
遇到非终结符，此时只需要调用这个非终结符对应的函数即可。在这里函数可能会递归的调用，这也是算法名称的来源。

void A() {
  X1,X2,...Xk = select a production
  for(i = 1 to k) {
    if(Xi is a non-terminal) {
      Xi();
    } else if(Is equal to the token) {
      Read in the next character
    } else {
      /* hadnle error */
    }
  }
}

但是非终结符的产生式不一定只有一个，所以就产生了选择问题，就需要回溯

一个想法：可以改变非终结符和对应的产生式的数据结构，比如用链表来存储产生式，如果当前产生式匹配失败就沿着链表进行下一个产生式的匹配

else {
  backtrack()
}

LL(1)语法解析

LL(1)算法属于自顶向下的分析算法，它的定义为：从左（L）向右读入一个符号，最左（L）推导，采用一个1前看符号。LL(1)算法和自顶向下分析算法本质上是一致的，它们的区别就在于LL(1)算法使用了一种称为分析表的工具来避免了回溯操作。

分析表的大概结构

/	输入字符
	terminator	terminator	EOF
non-terminal	0	2	-
non-terminal	1	3	4

即根据当前的非终结符和输入字符可以预测之后的产生式，以此来避免回溯

LL(1)的大概工作流程就是

将开始符号压入栈中
根据输入符号和分析表来选择产生式
把产生式都压入栈中
如果当前栈顶是终结符，就进行匹配
匹配失败退出，成功则读入，再回到第二个步骤

构建预测分析表

要构建预测分析表就需要根据产生式来生成三个集合，Firset set, Fllow Set, Select Set

先明白一个概念，如果一个非终结符，它可以推导出空集，那么这样的非终结符我们称之为nullable的非终结符

First Set的构建

对一个给定的非终结符，通过一系列语法推导后，能出现在推导表达式最左端的所有终结符的集合，统称为该非终结符的FIRST SET。

如果A是一个终结符，那么FIRST(A)={A}
对于以下形式的语法推导:

s -> A a

s是非终结符，A是终结符，a 是零个或多个终结符或非终结符的组合，那么 A 属于 FIRST(s).
对于推导表达式：

s -> b a

s 和 b 是非终结符，而且b 不是nullable的，那么first(s) = first(b)

对于推导表达式:

s -> a1 a2 … an b

如果a1, a2 … an 是nullable 的非终结符，b是非终结符但不是nullable的，或者b是终结符，那么

first(s) 是 first(a1)… first(an) 以及first(b)的集合。

public void buildFirstSets() {
      while (runFirstSetPass) {
          runFirstSetPass = false;
          Iterator<Symbols> it = symbolArray.iterator();
          while (it.hasNext()) {
              Symbols symbol = it.next();
              addSymbolFirstSet(symbol);
          }
      }
  }
  private void addSymbolFirstSet(Symbols symbol) {
      if (isTerminalSymbol(symbol.value)) {
          return;
      }
      for (int i = 0; i < symbol.productions.size(); i++) {
          int[] rightSize = symbol.productions.get(i);
          if (isTerminalSymbol(rightSize[0]) && !symbol.firstSet.contains(rightSize[0])) {
              runFirstSetPass = true;
              symbol.firstSet.add(rightSize[0]);
          } else if (!isTerminalSymbol(rightSize[0])) {
              addAdjacentFirstSet(symbol, rightSize);
          }
      }
  }
  private void addAdjacentFirstSet(Symbols symbol, int[] rightSize) {
      int pos = 0;
      Symbols curSymbol;
      do {
          curSymbol = symbolMap.get(rightSize[pos]);
          if (!symbol.firstSet.containsAll(curSymbol.firstSet)) {
              runFirstSetPass = true;
              for (int j = 0; j < curSymbol.firstSet.size(); j++) {
                  if (!symbol.firstSet.contains(curSymbol.firstSet.get(j))) {
                      symbol.firstSet.add(curSymbol.firstSet.get(j));
                  }
              }
          }
          pos++;
      } while (pos < rightSize.length && curSymbol.isNullable);
  }

Follow Set的构建

对于某个非终结符通过一系列推导变换后，某个终结符出现在该非终结符的后面，那么我们称该终结符属于对应非终结符的FOLLOW SET

先计算每一个非终结符的first set,并把每个非终结符的follow set设置为空.
对于表达式 s -> …a b…, a 是一个非终结符，b 是终结符或非终结符，那么FOLLOW(a) 就包含 FIRST(b).
对于表达式 s->…a a1 a2 a3… an b…, 其中a是非终结符，a1, a2 a3… an 是nullable的非终结符，b是终结符或非nullable的非终结符，那么FOLLOW(a) 包含FIRST(a1)… FIRST(an) FIRST(b)的集合。
对于表达式s -> … a 其中a是非终结符，而且a出现在右边推导的最后面，那么FOLLOW(a) 包含 FOLLOW(s)
对于表达式 s -> a a1 a2…an ，其中a是非终结符而且不是nullable的，a1 a2…an 是nullable的非终结符，那么FOLLOW(a), FOLLOW(a1)…FOLLOW(an) 都包含FOLLOW(s).

    public void buildFollowSets() {
        buildFirstSets();
        while (runFollowSetPass) {
            runFollowSetPass = false;
            Iterator<Symbols> it = symbolArray.iterator();
            while (it.hasNext()) {
                Symbols symbol = it.next();
                addSymbolFollowSet(symbol);
            }
            printAllFollowSet();
            System.out.println("***********************");
        }
    }
    private void addSymbolFollowSet(Symbols symbol) {
        if (isTerminalSymbol(symbol.value)) {
            return;
        }
        for (int i = 0;  i < symbol.productions.size(); i++) {
            int[] rightSize = symbol.productions.get(i);
            for (int j = 0; j < rightSize.length; j++) {
                Symbols current = symbolMap.get(rightSize[j]);
                if(isTerminalSymbol(current.value)) {
                    continue;
                }
                for (int k = j + 1; k < rightSize.length; k++) {
                    Symbols next = symbolMap.get(rightSize[k]);
                    addSetToFollowSet(current, next.firstSet);
                    if (!next.isNullable) {
                        break;
                    }
                }
            }
            int pos = rightSize.length - 1;
            while (pos >= 0) {
                Symbols current = symbolMap.get(rightSize[pos]);
                if (!isTerminalSymbol(current.value)) {
                    addSetToFollowSet(current, symbol.followSet);
                }
                if (isTerminalSymbol(current.value) && !current.isNullable) {
                    break;
                }
                pos--;
            }
        }
    }

Selction Set的构建

对于标号为N的推导表达式s -> a, 以及当前输入T, 那么SELECT(N)要包含T的话,必须是，当栈顶元素是s, 且输入为T时，要使用推导表达式N来进行下一步推导。

计算所以非终结符的first set 和follow set.
对应非nullable的表达式 , s -> a b… 其中s是非终结符，a 是一个或多个nullable的非终结符，b是终结符或是非终结符但不是nallable的，b后面可以跟着一系列符号，假设其标号为N,那么该表达式的选择集就是FIRST(a) 和 FIRST(b)的并集。如果a不存在，也就是b的前面没有nullable的非终结符，那么SELECT(N) = FIRST(b).
对应nullable的表达式: s -> a, s是非终结符，a是零个或多个nullable非终结符的集合，a也可以是ε，假设该表达式标号为N,那么SELECT(N)就是 FIRST(a) 和 FOLLOW(s)的并集。由于a可以是0个非终结符，也就是s -> ε,从而s可以推导为空，如果s推导为空时，那么我们就需要看看当前输入字符是不是FOLLOW(s)，也就是跟在s推导后面的输入字符，如果是的话，我们才可以采用s->ε,去解析当前输入。

private void buildSelectionSet() {
        buildFirstSets();
        buildFollowSets();
        Iterator<Symbols> it = symbolArray.iterator();
        while (it.hasNext()) {
            Symbols symbol = it.next();
            addSymbolSelectionSet(symbol);
        }
    }
    private void addSymbolSelectionSet(Symbols symbol) {
        if (isTerminalSymbol(symbol.value)) {
            return;
        }
        boolean isNullableProduction = true;
        for (int i = 0;  i < symbol.productions.size(); i++) {
            int[] rightSize = symbol.productions.get(i);
            ArrayList<Integer> selection = new ArrayList<Integer>();
            for (int j = 0; j < rightSize.length; j++) {
                Symbols next = symbolMap.get(rightSize[j]);
                if (!next.isNullable) {
                    isNullableProduction = false;
                    addSetToSelectionSet(selection, next.firstSet);
                    break;
                }
                addSetToSelectionSet(selection, next.firstSet);
            }
            if (isNullableProduction) {
                addSetToSelectionSet(selection, symbol.followSet);
            }
            symbol.selectionSet.add(selection);
            isNullableProduction = true;
        }
    }

构建完整的预测分析表

将解析表所有元素初始化为-1
for (每一个推导表达式 N) {

lhs = 推导表达式箭头左边的非终结符

for (对应每一个在SELECT(N)中的token) {

parse_table[lhs][token] = N

}

}

   private void setParsetTable() {
        Iterator it = symbolArray.iterator();
        while (it.hasNext()) {
            Symbols symbol = (Symbols) it.next();
            if (isTerminalSymbol(symbol.value)) {
                continue;
            }
            for (int i = 0;  i < symbol.selectionSet.size(); i++) {
                ArrayList<Integer> selection = symbol.selectionSet.get(i);
                for (int j = 0; j < selection.size(); j++) {
                    parseTable[symbol.value - SymbolDefine.NO_TERMINAL_VALUE_BASE][selection.get(j)] = productionCount;
                }
                productionCount++;
            }
        }
    }

递归下降和LL(1)语法分析的更多相关文章

TINY语言采用递归下降分析法编写语法分析程序
目录自顶向下分析方法 TINY文法消左提左.构造first follow 基本思想 python构造源码运行结果参考来源:聊聊编译原理(二) - 语法分析自顶向下分析方法自顶向下分析方法: ...
Atitit 表达式原理语法分析原理与实践解析java的dsl 递归下降是现阶段主流的语法分析方法
Atitit 表达式原理语法分析原理与实践解析java的dsl 递归下降是现阶段主流的语法分析方法于是我们可以把上面的语法改写成如下形式:1 合并前缀1 语法分析有自上而下和自下而上两种分析 ...
十一次作业——LL(1)文法的判断，递归下降分析程序
1. 文法 G(S): (1)S -> AB (2)A ->Da|ε (3)B -> cC (4)C -> aADC |ε (5)D -> b|ε 验证文法 G(S)是不 ...
LL(1)文法的判断，递归下降分析程序
1. 文法 G(S): (1)S -> AB (2)A ->Da | ε (3)B -> cC (4)C -> aADC | ε (5)D -> b | ε 验证文法 G ...
编译原理之LL(1)文法的判断，递归下降分析程序
1. 文法 G(S): (1)S -> AB (2)A ->Da|ε (3)B -> cC (4)C -> aADC |ε (5)D -> b|ε 验证文法 G(S)是不 ...
第十一次作业 LL(1)文法的判断，递归下降分析程序
1. 文法 G(S): (1)S -> AB (2)A ->Da|ε (3)B -> cC (4)C -> aADC |ε (5)D -> b|ε 验证文法 G(S)是不 ...
编译原理-递归下降分析法 c程序部分的分析
实验三语法分析程序实验专业商软2班姓名黄仲浩学号 201506110166 一. 实验目的编制一个部分文法分析程序. 二. 实验内容和要求输入:源程序字符串输出:正确 ...
第十一次 LL(1)文法的判断，递归下降分析程序
1. 文法 G(S): (1)S -> AB (2)A ->Da|ε (3)B -> cC (4)C -> aADC |ε (5)D -> b|ε 验证文法 G(S)是不 ...
编译原理：LL(1)文法的判断，递归下降分析程序
1. 文法 G(S): (1)S -> AB (2)A ->Da|ε (3)B -> cC (4)C -> aADC |ε (5)D -> b|ε 验证文法 G(S)是不 ...

随机推荐

LoadRunner【第一篇】下载、安装、破解、修改端口号
loadrunner11下载 loadrunner11大小有4g多,相对另外一款开源的性能测试工具jmeter来说,是非常笨重的了,可以关注公众号联系作则获取. loadrunner11安装(win7 ...
web万维网 -- 基础概念
Web(万维网World Wide Web的简称)是个包罗万象的万花筒,不同的人从不同的角度观察,对于Web究竟是什么会得出大不相同的观点. 百科:web(World Wide Web)即全球广域网, ...
编程语言的类型修饰符modifiers
编程语言修饰符,代表语言要素与常规表达不同的语义: 这些语义的不同需要编译器和运行时作出不同的解释: 作用域.访问: 生命周期: 同步异步: 多态: 纯函数: 注解: 懒加载: 编译器合成:
基于链表的栈（Java）
package com.rao.linkList; /** * @author Srao * @className LinkedStack * @date 2019/12/3 13:59 * @pac ...
Linux 检测 tls
检测 tls # openssl s_client -connect intl.jdair.net: -tls1
LVS 的负载均衡调度算法
LVS 的负载均衡调度算法 1.轮叫调度 (Round Robin) ( rr ) 调度器通过“ 轮叫 ”调度算法将外部请求按顺序轮流分配到集群的真实服务器上,它均等地对待每一台服务器,而不管服务器上 ...
ssl 原理简介
要想弄明白SSL认证原理,首先要对CA有有所了解,它在SSL认证过程中有非常重要的作用.说白了,CA就是一个组织,专门为网络服务器颁发证书的,国际知名的CA机构有VeriSign.Symantec,国 ...
[已解决] Python logging 重复打印日志信息
问题描述问题代码如下: def get_logger(logger_name): """得到日志对象""" logger = loggin ...
Tecplot显示周期和对称算例
源视频链接:https://pan.baidu.com/s/1HdU3nsti8qLZhXvISxsSFA 提取码: 3kfu 模型链接:https://pan.baidu.com/s/1CQCGL7 ...
【Gamma】Scrum Meeting 2
目录写在前面进度情况任务进度表 Gamma阶段燃尽图遇到的困难照片写在前面例会时间:5.26 22:30-23:00 例会地点:微信群语音通话代码进度记录github在这里临近期末, ...

递归下降和LL(1)语法分析