BUAA-OO-表达式解析与求导

解析

按照常规,解析这一部分我们分为词法分析与语法分析。当然由于待解析的字符串较简单,词法分析器和语法分析器不必单独实现。

词法分析器

按照常规,我们先手写一个词法分析器,而不使用正则表达式。

词法分析器:读取字符流,产生标记流。它聚合字符形成单词,并应用一组规则来判断每个单词在源语言中是否合法,如果合法则为其分配一个语法范畴,产生一个标记。

我们的词法分析器行为如下:

  • 如果 当前输入有定义,则 为其产生一个标记(token, token value)。譬如:当前输入是"+114514",则为其产生标记(Num, +114514);当前输入是"*",则为其产生标记(Op,*),诸如此类。
  • 如果 当前的输入无定义,则 抛出错误。譬如:当前输入是"y",则抛出错误。

可能你已经发现,这个词法分析器并不能很好地满足我们的需求:当输入为"+114514"时,如何判断是"+",或是"+114514"呢?

这里我们需要额外介绍一个概念:lookahead,即提前看多个字符。由于有一个或多个标记是以相同的字符开头的,仅凭当前的字符无法确定具体应该解释为哪个标记,所以只能再向前查看字符。以"+114514"为例,在解析到"+"之后,还需要向前查看一个字符"1",此时就能够确定当前输入对应的标记种类应为 Num。

具体实现

完成词法分析器的行为定义之后,我们开始进行更为详尽的设计。

首先,由定义,我们可以得到我们所需的标记种类:

  1. /**
  2. * Num : 数字
  3. * Op : 运算符
  4. * Sin : Sin函数
  5. * Cos : Cos函数
  6. * X : 幂函数
  7. * LP : 左括号
  8. * RP : 右括号
  9. * NULL: 字符流末尾
  10. */
  11. enum TokenType {
  12. Num, Op, Sin, Cos, X, LP, RP, NULL
  13. }

接下来就是枯燥的枚举:

  1. void getTok() {
  2. token="";
  3. tokenType = TokenType.NULL;
  4. // consume blank char
  5. { /* some code */ }
  6. // reach the end
  7. { /* some code */ }
  8. switch (currentCharacter) {
  9. case 'x' :
  10. /* some code */
  11. case 's' :
  12. /* some code */
  13. default :
  14. throw new someKindOfException();
  15. }

词法分析器部分告一段落。

语法分析器

文法

首先根据定义给出文法

  1. <expr> ::= <expr> + <term>
  2. | <expr> - <term>
  3. | <term>
  4. <term> ::= <term> * <factor>
  5. | <factor>
  6. <factor> ::= (<expr>)
  7. | Num
  8. | sin(<factor>)
  9. ...

在文法中出现了两种符号,一种是被<>包围的非终结符,如<expr>,可以用 ::= 右侧的式子替代;另一种是没有出现在 ::= 左侧的终结符,如 Num,一般对应于词法分析器输出的标记。

解析过程

然后是递归下降的解析过程,关于什么是递归下降,稍后会进行解释。以 1*(2+3) 为例

  1. <expr> => <expr>
  2. => <term> * <factor>
  3. => <factor> |
  4. => Num (3) |
  5. => (<expr>)
  6. => <expr> + <term>
  7. => <term> |
  8. => <factor> |
  9. => Num (2) |
  10. => <factor>
  11. => Num (3)

整个解析的过程是在不断对非终结符进行替换(向下),直到遇到了终结符(底)。在解析的过程中,有的非终结符,如<expr>被递归地使用了。

递归下降:从起始非终结符开始,不断地对非终结符进行分解,直到匹配输入的终结符。

可以看出,整个解析的过程和我们的文法是十分相近的,我们可以很容易地将文法直接转换成实际的代码,只需为每个非终结符定义一个对应的函数。不过,很显然我们的文法是没有办法直接翻译成实际代码的,这是编译原理的内容了,此处不再赘述。

除了递归下降以外,还可以选择使用自底向上的方法进行语法分析,由于是手写语法分析器,我们不考虑采用自底向上。

语法树

根据解析过程,我们很自然地会想到树这种数据结构。一个简略的语法树如下

  1. expr
  2. / | \
  3. term term ...
  4. / | \
  5. num sin cos ...

具体实现

以下是根据文法直接翻译的一个可能的实现。

  1. Expr parseExpr() {
  2. Expr result = new Expr();
  3. loop {
  4. // create a node
  5. Term term = parseTerm();
  6. // attach
  7. result.addNode(term);
  8. }
  9. return result;
  10. }
  11. Term parseTerm() {
  12. Term result = new Term();
  13. loop {
  14. // create a node
  15. Factor factor = parseFactor();
  16. // attach
  17. result.addNode(factor);
  18. }
  19. return result;
  20. }
  21. Factor parseFactor() {
  22. Factor result = new Factor();
  23. loop {
  24. {/* some code */}
  25. }
  26. return result;
  27. }

至此,已完成对输入字符串的解析。

求导

根据字符串解析的方法,我们求导的方式也是自顶向下的。

以下是根据语法树得到的一个可能的实现

  1. Expr exprDiff() {
  2. Expr result = new Expr();
  3. for (term : termContainer) {
  4. result.addNode(termDiff(term));
  5. }
  6. return result;
  7. }
  8. Term termDiff() {
  9. Term result = new Term();
  10. for (factor : factorContainer) {
  11. result.addNode()
  12. }
  13. return result;
  14. }
  15. Factor factorDiff() {
  16. return diff();
  17. }

个人实现分析

度量分析

UML类图:

Method Metrics:

Class Metrics:

以上为第三次表达式解析与求导作业的UML图和代码指标度量。可以看得出来其中不乏有许多设计和算法问题,譬如

  • 没有另外设置一个Factor的抽象类或者接口,而是将各种Functions直接继承自Expr
  • 模块间的耦合度高,没有合理地设计每个类暴露的接口形状
  • 没有在创建树结点时存储其相应的HASH值,而是在每次进行相等性判断时都进行一次递归运算,大大提高了时间复杂度
  • 在判断相等时用的是简单的遍历比较,而不是设计一个可以避免碰撞的HASH函数

设计模式

简单地运用了工厂模式,将各种Functions的创建托管至Expr。但是这并不是一个好的设计,应该如上述,Expr和各种Functions都继承自Factor抽象类,然后创建一律托管至FactorFactory。否则Functions实现的改变可能会影响Expr实现的改变,这将增大迭代开发和后期维护的复杂度。

BUAA-OO-表达式解析与求导的更多相关文章

  1. OO第一单元总结——求导

    一.基于度量分析程序结构 (一)第一次作业 (1)设计思路 本次作业只涉及到简单幂函数通过加减运算而复合而成的函数,因此笔者自然的把函数分成了函数本体以及单个的项两个部分,在笔者的设计中两个类的功能如 ...

  2. oo第一次博客-三次表达式求导的总结与反思

    一.问题回顾与基本设计思路 三次作业依次是多项式表达式求导,多项式.三角函数混合求导,基于三角函数和多项式的嵌套表达式求导. 第一次作业想法很简单,根据指导书,我们可以发现表达式是由各个项与项之间的运 ...

  3. OO_Unit1_表达式求导总结

    OO_Unit1_表达式求导总结   OO的第一单元主要是围绕表达式求导这一问题布置了3个子任务,并在程序的鲁棒性与模型的复杂度上逐渐升级,从而帮助我们更好地提升面向对象的编程能力.事实也证明,通过这 ...

  4. 2019年北航OO第1单元(表达式求导)总结

    2019年北航OO第1单元(表达式求导)总结 1 基于度量的程序结构分析 量化指标及分析 以下是三次作业的量化指标统计: 关于图中指标在这里简要介绍一下: ev(G):基本复杂度,用来衡量程序非结构化 ...

  5. 2020 OO 第一单元总结 表达式求导

    title: BUAA-OO 第一单元总结 date: 2020-03-19 20:53:41 tags: OO categories: 学习 OO第一单元通过三次递进式的作业让我们实现表达式求导,在 ...

  6. OO第一单元作业总结——表达式求导

    OO第一单元作业总结 第一次作业 基于度量分析代码结构 基本算法 第一次作业是简单多项式导函数求解,不需要对输入数据的合法性进行判定, 基本思想是用 (coeff, expo)表示二元组 coeff* ...

  7. OO第一单元总结——表达式求导

    第一次作业 (1) UML结构图 (2)结构分析 Polynomial 类是对输入的字符串进行预处理,其中包括判断格式是否合法,运算符简化,分割成项等方法. Polynomial处理后得到的每一个项的 ...

  8. OO Unit 1 表达式求导

    OO Unit 1 表达式求导 面向对象学习小结 前言 本博主要内容目录: 基于度量来分析⾃己的程序结构 缺点反思 重构想法 关于BUG 自己程序出现过的BUG 分析⾃己发现别人程序bug所采⽤的策略 ...

  9. 2019年北航OO第一单元(表达式求导任务)总结

    2019面向对象课设第一单元总结 一.三次作业总结 1. 第一次作业 1.1 需求分析 第一次作业的需求是完成简单多项式导函数的求解,表达式中每一项均为简单的常数乘以幂函数形式,优化目标为最短输出.为 ...

随机推荐

  1. 华为笔记HOSTS,便于访问云端存储

    # Copyright (c) - Microsoft Corp. # # This is a sample HOSTS file used by Microsoft TCP/IP for Windo ...

  2. 毕业设计(2):基于MicroPython的家庭可燃气体泄露微信报警器

    在我们平时的生活中,经常看到因气体泄漏发生爆炸事故的新闻.房屋起火.人体中毒等此类的新闻报道层出不穷.这种情况下,人民就发明了可燃气体报警器.当工业环境.日常生活环境(如使用天然气的厨房)中可燃性气体 ...

  3. Mysql数据库引擎介绍--转载

    引用博文链接:https:/www.cnblogs.com/zhangjinghe/p/7599988.html MYSQL数据库引擎区别详解 数据库引擎介绍 MySQL数据库引擎取决于MySQL在安 ...

  4. Quick Sort(三向切分的快速排序)(Java)

    //三向切分的快速排序 //这种切分方法对于数组中有大量重复元素的情况有比较大的性能提升 public static void main(String[] args) { Scanner input ...

  5. foreman容器化部署

    一.前言 最近公司要求对一批GPU服务器安装操作系统,之前同事一直采用cobbler安装系统,一旦服务器设置为pxe优先启动,会出现重复安装系统的问题,并且如果线上服务器忘记修改第一启动项为硬盘启动, ...

  6. 工具(1): 极简Word排版示例(Example by Word2013)

    文档标题 第一行写下文档的名字,居中,微软雅黑字体,三号 章节标题 每一章的标题单独一行,光标选中这行,设置为标题1 每一节的标题单独一行,光标选中这行,设置为标题2 全部章节标题设置完毕后,下一步 ...

  7. SpringBoot+AOP整合

    SpringBoot+AOP整合 https://blog.csdn.net/lmb55/article/details/82470388 https://www.cnblogs.com/onlyma ...

  8. Could not retrieve mirrorlist http://mirrorlist.centos.org/?release=7&arch=x86_64&repo=os&infra=stock32 error was 14: curl#6 - "Could not resolve host: mirrorlist.centos.org; Unknown error"

     今天安装完带图形界面的CentOS 7后,在Terminal中运行yum安装命令时报了以下错误: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ...

  9. iOS 枚举 初体验

    iOS枚举 我的code /*文件名 SC_CDV_OCR.m*/ typedef enum _OCRResultState { OCRResultStateOK = 1, OCRResultStat ...

  10. ftm国际化解决方案

    记录一下踩过的坑,在使用ftm:message的时候我发现这个的国际化是依赖于本地浏览器的语言环境的!关于自主设置这个语言的方法有如下3种:(个人建议使用第二种,可以更加灵活且有效!第一种我这边没有生 ...