00.一个JVM语言的诞生

由于方才才获悉博客园文章默认不放在首页的, 原创文章主要通过随笔显示, 所以将文章迁移到随笔;

这篇帖子将后续更新, 欢迎关注! 这段时间要忙着春招实习, 所以项目更新会慢一点,

语言组织也会比较随意, 毕竟时间有限, 没办法太过雕琢琢磨了.

源码github仓库, 如果这个系列对您有帮助, 请您给我一个小小的star!

本节提纲

  1. 写在前面

  2. 文章目录

  3. 先修技能/工具

  4. Cva文法-grammar推导式

  5. 说明

  6. Cva程序样例

写在前面

从屏幕前的你搜索到这篇博文开始, 我们就要开始一篇实现自己的JVM语言系列了, 目前国外有大佬做了

一个Enkel语言, 还有翻译教程, 不过恕我直言教程太跳了, 很多细节语焉不详, 也可能是翻译的原因,

所以我希望写一个国人的自制JVM语言系列教程, 在这之间我已经完成了github项目, 语言已经能实现很多

基本的Java的特性(方法, 循环, 简单的面向对象与继承), 你可以直接使用之, 在此基础上构建你的项目,

或者大家可以一起提交修改, 让Cva成为一个更棒的语言我们将其名字暂定为Cva, 开始也有想过比较霸气的alloy,

但是看到这好像已经是一个语言了, 当然, 目前我们的语言这么菜, 也不好意思叫Alloy(其实叫Cva都是我脸皮厚,

哈哈

为什么叫Cva, 其实我一开始的设想是这个语言的最终目的是兼容C(但愿吧, 毕竟C的类型系统和很多糟粕还是没必要学着),

目前是相当小相当菜的一个子集, 毕竟C的语法还是相当复杂, 现在毕业找工作的压力比较大, 所以这个项目

真正对C兼容还是有很长的路要走的

不过人嘛, 梦想总是要有的, 写一个编译器有一个自己的语言何不是很多程序员毕生的梦想? 为了写这个语言,

笔者从去年11月开始尝试了很多方法, 有github上其他同学的大作业, 有读龙书虎书鲸书, <两周自制脚本语言>,

有网易云Coding 迪斯尼的自底向上, 前前后后推翻了很多方案, 改了很多版本, (说实话自底向上真的太抽象了,

相当劝退), 最终完成这个项目却不过区区十来天, 主要是过年那段时间, 每天废寝忘食地写代码提交,

经常半夜构思想的睡觉都睡不着, 经过长时间的积累

最终算是勉强完成了一个差强人意的版本把, 在这里由于春招临近的缘故, 笔者不得不收心去准备春招实习面试,

所以把这个项目的教程写完后可能就暂时停止更新, 至于再见的时间? 我也不清楚, 可能是春招结束放荡的大四

(但是万一要提前去公司实习干活呢?), 所以有点遥遥无期的意味

不过这些文章会将一个编译器从0到1的实现过程, 尽可能简单易懂地展现给大家, 当你读完这个系列的文章,

理解了编译器(其实本文基本都是前端, 后端基本都被JVM做完了, 后面我可能会写一个自制JVM系列,

不过在这之前还是先推出自制操作系统和实现TCP/IP协议栈系列吧)加上我前期调教好的代码,相信即使你是小白,

也能快速定制自己的需求, 快速书写出一个自己的语言!

文章目录


01.从0实现一个JVM语言之架构总览

架构总览目前完成度较低, 因为可能要等我写完大部分文章后才会回头梳理一下架构.

02.从0实现一个JVM语言之词法分析器-Lexer

03.从0实现一个JVM语言系列之语法分析器-Parser

先修技能/工具

  1. 比较熟练的JavaSE基础即可

  2. JDK1.8及以上版本, 源码中有大量利用了Java8函数式特性的地方

  3. jasmin汇编器, 在github仓库的lib目录下

Cva文法

Grammar 推导式

Program
-> pkg com.company.proj; // 包名目前是可有可无的. 没啥用
-> call com.company.somepkg; // 导包目前也是摆设, 可有可无
-> EntryClass(入口类, 拥有main方法, 位置是任意的)
| EntryMethod
| ClassDeclList EntryClass
-> class Entry(默认为Application)
{
retType main()
{
StatementList
}
} ClassDeclList
-> ClassDecl
| ClassDecl ClassDeclList ClassDecl
-> class Identifier
{
VarDeclList MethodDeclList
}
| class Identifier : Identifier
{
VarDeclList MethodDeclList
} VarDeclList
-> VarDecl
| VarDecl VarDeclList
| VarDecl -> Type Identifier; MethodDeclList
-> MethodDecl
| MethodDecl MethodDeclList
| MethodDecl -> Type Identifier (FormalList)
{
VarDeclList StatementList return Expr;
} FormalList
-> Type Identifier
// formal就是形参, args;
| Type Identifier, FormalList
| Type -> int
-> boolean
... 其他的目前还不支持
-> Identifier StatementList
-> Statement
| Statement StatementList
| Statement
-> { StatementList }
// 多条语句构成Block, 要加上大括号限定域;
| if (Expr) Statement else Statement
| while (Expr) Statement
// write 也可以是writeln, writef, writef目前不支持;
| write(Expr);
| Identifier = Expr; Expr
-> Expr Op Expr
| Expr.Identifier(ExprList)
| IntegerLiteral
| Identifier
| this
| new Identifier()
| Const ...(包括const int, true, false)
| !Expr
| (Expr) Op -> +
| -
| *
| <
| && ExprList
-> Expr
| Expr, ExprList
| Identifier -> [A-Za-z_][A-Za-z0-9_]* IntegerLiteral -> [0-9]+ LineComment -> // the total line is comment

说明

  • 目前Cva支持 int boolean 两种基本类型, 进阶类型支持 string 支持自定义的类类型
  • 在类类型中支持字段和实例方法, 不支持静态方法, 不支持方法重载/重写,

    不支持访问权限控制(默认为 public ), 支持继承(若无显式父类声明,

    则默认继承自 Object 类型), 但不支持显式调用父类方法
  • 支持 if/if-else while for 的分支和循环控制, 支持方法调用)
  • 运算符支持 基本运算 + - * / % && = . ! <

    自增运算 ++ --

    以及位操作运算 & | ^ >> << >>> 等其他运算符

    域限定符 { } ( ) ;``, 比较运算支持 <, 逻辑运算支持 && !
  • 支持引导的C家族的 // 行注释以及 /* ... */ 块注释
  • 字段和变量仅支持声明后赋值或者声明时初始化
  • 编译器目前仅支持将所有代码写在同一个文件内部, 需要有一个入口main方法(可以没有main类,

    仅有main方法, 但编译器会自动生成Application类), main 方法支持空参, 也支持仅有一个

    string[]传入命令行参, 当然目前也没有去处理, 只是个摆设

由以上文法给出的Cva程序样例

class Entry
{
/**
* This is the entry point of the program;
*/
int main(string[] args)
{
echo "Hello, CvaWorld\n";
// 打印整形 statement
println(new FibCalcer().compute(10));
return 0;
}
} class FibCalcer
{
int compute(int num)
{
int total;
if ( num < 1)
{
// 花括号是可以不要的, 但是我们的代码要遵守阿里巴巴Cva规范(滑稽);
total = 1;
}
else
{
total = num * (this.compute(num - 1));
}
// 目前不支持提前 return, 挺遗憾的;
return total;
}
}

当然, main方法也有野的写法, 但目前Cva仅支持将main方法这么写

int main(string[] args)
{
echo "Hello, CvaWorld\n";
return 0;
}

即main类不需要定义, 只需要声明main方法即可, 当然, 这不过是语法糖一颗,

编译时会自动加上默认主类名Application(这样会出现的名称冲突问题暂时还没解决)

00.从0实现一个JVM语言系列的更多相关文章

  1. 04.从0实现一个JVM语言系列之语义分析器-Semantic

    从0实现JVM语言之语义分析-Semantic 源码github, 如果这个系列文章对您有帮助, 希望获得您的一个star 本节相关语义分析package地址 致亲爱的读者: 个人的文字组织和写文章的 ...

  2. 03.从0实现一个JVM语言系列之语法分析器-Parser-03月01日更新

    从0实现JVM语言之语法分析器-Parser 相较于之前有较大更新, 老朋友们可以复盘或者针对bug留言, 我会看到之后答复您! 源码github仓库, 如果这个系列文章对你有帮助, 希望获得你的一个 ...

  3. 01.从0实现一个JVM语言之架构总览

    00.一个JVM语言的诞生过程 文章集合以及项目展望 源码github地址 这一篇将是架构总览, 将自顶向下地叙述自制编译器的要素; 文章目录 01.从0实现一个JVM语言之架构总览 架构总览目前完成 ...

  4. 05.从0实现一个JVM语言之目标平台代码生成-CodeGenerator

    从0实现JVM语言之目标平台代码生成-CodeGenerator 源码github仓库, 如果这个系列文章对你有帮助, 希望获得你的一个star 本节相关代码生成package地址 阶段性的告别 非常 ...

  5. 02.从0实现一个JVM语言之词法分析器-Lexer-03月02日更新

    从0实现JVM语言之词法分析器-Lexer 本次有较大幅度更新, 老读者如果对前面的一些bug, 错误有疑问可以复盘或者留言. 源码github仓库, 如果这个系列文章对你有帮助, 希望获得你的一个s ...

  6. 00 你的第一个C语言程序

    C语言简介 C 语言是一种通用的.面向过程式的计算机程序设计语言,即编程语言. 为移植和开发 UNIX 操作系统,丹尼斯·里奇于1972年在贝尔电话实验室设计开发了 C 语言的第一个版本. C 语言同 ...

  7. JVM基础系列第1讲:Java 语言的前世今生

    Java 语言是一门存在了 20 多年的语言,其年纪比我自己还大.虽然存在了这么长时间,但 Java 至今都是最大的工业级语言,许多大型互联网公司均采用 Java 来实现其业务系统.大到国际电商巨头阿 ...

  8. 用SignalR 2.0开发客服系统[系列5:使用SignalR的中文简体语言包和其他技术点]

    前言 交流群:195866844 目录: 用SignalR 2.0开发客服系统[系列1:实现群发通讯] 用SignalR 2.0开发客服系统[系列2:实现聊天室] 用SignalR 2.0开发客服系统 ...

  9. JavaRebel 2.0 发布,一个JVM插件

    JavaRebel是一个JVM插件(-javaagent),能够即时重载java class更改,因此不需要重新部署一个应用或者重启容器,节约开发者时间. JavaRebel 2.0的新特征: 改变了 ...

随机推荐

  1. 2019牛客暑期多校训练营(第十场)F.Popping Balloons(线段树)

    题意:现在给你n个点 现在让你横着划三条线间距为r 然后竖着划三条线间距同样为r 现在让你求经过最多的点数 思路:我们首先建一棵关于y区间的线段树 然后枚举x轴 每次更新重叠的点 然后再更新回去 找一 ...

  2. rabbitMq学习一

    1.安装rabbitmq Windows下安装 首先,我们访问官网[https://www.rabbitmq.com/],点击Get Started. 选择下载安装,由于RabbitMQ使用Erlan ...

  3. python之字符串replace的方法

    1.描述 replace()方法把字符串中的old(旧字符串)替换成new(新字符串),如果有指定第三个参数max,则替换的不超过max次 2.语法 str.replace(old,new[,max] ...

  4. LINUX - 寄存器和堆栈

    堆栈模型: 函数调用: EBP:ESP EBP当前调用函数的栈底: ESP当前调用函数的栈顶: ---------------------------------------------------- ...

  5. C++ 结构体 segment fault

    形如 struct node { int key; int height; int size; //tree node 个数 node *left, *right; node(int x) : key ...

  6. 牛客网-Beauty of Trees 【加权并查集】

    锟斤拷锟接o拷https://www.nowcoder.com/acm/contest/119/A锟斤拷源锟斤拷牛锟斤拷锟斤拷 锟斤拷目锟斤拷锟斤拷 It锟斤拷s universally acknow ...

  7. 2021-2-16:请问你知道分布式设计模式中的Quorum思想么?

    有效个数(Quorum) 有效个数(Quorum)这个设计模式一般是指分布式系统的每一次修改都要在大多数实例上通过来确定修改通过. 问题背景 在一个分布式存储系统中,用户请求会发到一个实例上.通常在一 ...

  8. document.URL vs window.location.href All In One

    document.URL vs window.location.href All In One document.URL 与 window.location.href 两者有啥区别 document. ...

  9. PyCharm 中文 字符 python 报错 的 完美 解决方案!

    PyCharm 中文 字符 python 报错 的 完美 解决方案! #_*_ coding:utf-8_*_ https://www.python.org/dev/peps/pep-0263/ 到p ...

  10. React Fragment All In One

    React Fragment All In One React还提供了一个无需包装即可呈现多个元素的组件. https://reactjs.org/docs/react-api.html#fragme ...