前言

不要让用户被那些“专业术语”吓住!
用心设计的提示和反馈信息是软件设计者的“职业良心”。
 
内容
1 存在哪些错误?
2 美化错误提示
3 错误恢复策略
 
1 存在哪些错误?
在DSL语言开发周期内,首先需要设计文法,根据文法生成翻译器,然后输入语言样本测试翻译器的效果,以及根据存在的翻译问题调整翻译策略。这其中就可能存在两类错误:文法错误语言样本错误
在Parr将一些错误拉出来游街,以及盛赞ANTLR在错误提示和恢复方面的优异表现的描述中,可以观察到一些错误提示和恢复的策略和惯例:
(1)错误恢复是从语言样本中的语法错误中恢复过程,常通过修改输入符号或吃掉一些符号直到解析器到达识别了一个确定性的规则状态;
(2)应该极力避免级联错误提示信息,即每个语法错误只给出一条错误提示信息。
 
2 美化错误提示
打开ANTLR的-dfa选项,可以通过查看生成的DFA,了解识别器的决策和状态信息。
 
为实现美化的错误提示,在文法中覆盖BaseRecognizer的getErrorMesage()和getTokenErrorDisplay()方法。(文中要求覆盖displayRecognitionError()而不是getErrorMesage(),其实查看生成的代码可以产出前者会调用后者)。
 
一些内建的异常类
异常 说明
RecognitionException 识别异常。ANTLR生成的识别器抛出异常的基类。记录错误发生时的输入流信息:识别器当前看到的符号(字符、Token或树节点)的索引,错误符号的指针、当前行、行内位置。
MismatchedTokenException Token不匹配异常。指出解析器预期的特定符号当前未找到。记录额外的Token类型信息。
MismatchedTreeNodeException 树节点不匹配异常。 与上一异常类似,指出树解析器预期的特定token类型节点未找到。
NoViableAltException 无可行选项异常。识别器达到决策点,但向前看符号与所有选项均不一致。记录向前看DFA中决策号和状态号,同时记录做出此决策的一块文法。
EarlyExitException 过早退出异常。识别(...)+ EBNF子规则时,只少匹配一个,但该规则没有匹配任何符号。记录DFA中决策号。
FailedPredicateException 失败的谓词异常。语义谓词求值为false。记录规则名称和谓词文本。
MismatchedRangeException 范围不匹配异常。范围如[a..z],未匹配范围中任何符号。记录范围中最小和最大元素。
MismatchedSetException 集合不匹配异常。集合如{'a','b'},未匹配集合中任何符号。记录集合中所有符号。
MismatchedNostSetException 非集合不匹配异常。非集合指用~操作符表示的集合的拟。与上一个异常类似。
 
ANTLR识别器不用字符串信息创建异常对象,只跟踪和记录必要的用于生成错误的现场信息。
基识别器类BaseRecognizer中多个报告错误方法可以生成本地的错误信息,不要指望从上面的异常类中getMessage()方法返回什么异常信息。
 
除异常信息外,可以在文法中用自定义动作提供错误信息。
一个重要的错误信息提示是指出发生错误时所用的解析规则(栈),一般方法是在文法@members中定义个错误信息栈,在对用户意义最清晰的规则中的@init/@after动作中分别执行入栈和出栈操作,同时在@memebers动作中覆盖getErrorMessage()方法,它使用该错误信息栈的peek()获取当前现场的提示信息。
 
错误零容忍:遇到第一个错误立即退出
需要在文法@members动作中覆盖mismatch()、recoverFromMismatchedSet()方法以及覆盖默认的@rulecatch。
 
覆盖@rulecatch动作会对所有规则产生影响,可以采用细粒度的规则级catch动作来执行手动恢复操作。
 
词法和树文法的错误与一般文法类似,区别仅在于处理的是字符和树节点。
 
3 错误恢复策略
站在巨人的肩膀上
ANTLR的错误恢复机制参考了Nikalaus Wirth的"Algorithms + Data Structures = Programs"(八卦一下:好像他靠这句话拿到图灵奖)、Rodney Topor的"递归下降解析器中错误恢复记录"和一些Josef Grosch在CoCo解析器生成器的一些思路。
 
本质上的思路是,识别器在遇到不匹配的符号错误时,先尽可能的尝试单个符号插入删除是否可以恢复,如果不能,再吞掉一些符号直到向前看符号属于一个重新同步集(resynchronization set)后退出该规则。
 
重新同步集是输入符号的集合,这些符号可以合法的在当前规则和当前规则调用链中出现。

ANTLR3完全参考指南读书笔记[08]的更多相关文章

  1. ANTLR3完全参考指南读书笔记[01]

    引用 Terence Parr. The Definitive ANTLR Reference, Building Domain Specific Languages(antlr3 version). ...

  2. ANTLR3完全参考指南读书笔记[06]

    前言 这段时间在公司忙的跟狗似的,但忙的是没多少技术含量的活儿. 终于将AST IR和tree grammar过了一遍,计划明天写完这部分的读书笔记.   内容 1 内部表示AST构建 2 树文法   ...

  3. ANTLR3完全参考指南读书笔记[02]

    前言 程序语言是什么? 用wiki上的描述,程序语言是一种人工设计的语言,用于通过指令与机器交互:程序语言是编程程序的标记,而程序是一种计算或算法的描述.详细介绍和背景信息参考: Programmin ...

  4. ANTLR3完全参考指南读书笔记[07]

    前言 真正意义上的程序员都很懒,懒的连多余的一行代码也不写. 如果能将底层满手油污的活儿都可以交给别人去做,自己就扮演个智囊团成员的角色,生活会比想象中的还要惬意. 严格的按照指令执行长时间不知疲倦的 ...

  5. ANTLR3完全参考指南读书笔记[05]

    前言 仅生成给出true/false的识别器是没有多大用处的,自然的就有在识别过程中遇到某一结构时执行一段代码.存储该结构中信息的想法. ANTLR提供了在文法中嵌入属性和动作超级混合“文法”,可以生 ...

  6. ANTLR3完全参考指南读书笔记[04]

    前言 学习框架或第三方库的方法是什么 (1)少量的浏览manual或tutoral,只关注程序所需的特征,再完善其详细内容和特征的认识? (2)花大量的时间研究详细内容,再考虑程序实现? 这是个先有鸡 ...

  7. ANTLR3完全参考指南读书笔记[03]

    前言 文中第4章内容有点多,有点枯燥,但不坚持一下,之前所做的工作就白做了. 再次确认一下总体目标: protege4编辑器中Class Definition中语法解析和错误提示: Java虚拟机规范 ...

  8. HTTP权威指南读书笔记

    HTTP权威指南笔记 读书有两种境界,第一种境界是将书读薄,另一种是读厚.本篇文章就是HTTP权威指南的读书笔记,算是读书的第一重境界,将厚书读薄.文章对HTTP的一些关键概念做了比较详细的概述,通读 ...

  9. css权威指南读书笔记

    今天翻手机,翻到了许久之前看css权威指南时的笔记,遂移到博客中来. 1.属性选择器p.one class名为one的p元素p[class][name] 含有class和name属性的p元素p[cla ...

随机推荐

  1. c++ 普通高精减

    //c++ 普通高精减 //codevs 3115 高精度练习之减法 //内容简单,就不注释了. //注意下,&&优先级高于||. #include<cstdio>#inc ...

  2. 三元运算+lambda表达式

    #三元运算,三目运算,if else简写 if 1 == 1: name = "liangml" else: name = "NB" #如果 1==1 成立,n ...

  3. NodeJs编写小爬虫

    一,爬虫及Robots协议 爬虫,是一种自动获取网页内容的程序.是搜索引擎的重要组成部分,因此搜索引擎优化很大程度上就是针对爬虫而做出的优化. robots.txt是一个文本文件,robots是一个协 ...

  4. (BFS)hdoj2377-Bus Pass

    题目地址 因为最后要看的是到所有路线上的区域最大距离最小的中心点,所以可以采取遍历路线上所有的区域,对每个区域进行BFS的办法.为了更方便的在每一次BFS都遍历所有的区域,可以加一个reach数组,记 ...

  5. 工具&符号

    持续更新中...... 1.RPC(Remote Procedure Call Protocol)——远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议.RP ...

  6. 近期C++编译问题汇总

    编译c++ 代码中遇到几个问题,汇总一下: 1.编译openssl 遇到问题如图 ,  原因:不支持汇编编译,在perl编译指令中加入: no-asm , 如:perl Configure VC-WI ...

  7. OpenCV函数解读之groupRectangles

    不管新版本的CascadeClassifier,还是老版本的HAAR检测函数cvHaarDetectObjects,都使用了groupRectangles函数进行窗口的组合,其函数原型有以下几个: C ...

  8. VMWare Workstation 10.0 Preview CN

    What's New in the VMware Workstation Technology Preview July 2013 The VMware Workstation team is exc ...

  9. iphone/ipod网页开发教程及规则

    侦测iPhone/iPod 开发特定设备的移动网站,首先要做的就是设备侦测了.下面是使用Javascript侦测iPhone/iPod的UA,然后转向到专属的URL. if((navigator.us ...

  10. selectNodes

    解析beans.xml的时候有时候找不到节点,把其他多余的删除之后就好了,不知道为什么.