【词法结构】字符集、注释、直接量、标识符和保留字、可选的分号

【字符集】

JavaScript程序是用Unicode字符集编写的。

Unicode是ASCII和Latin-1的超集,支持地球上几乎所有在用的语言。

ECMAScript 3 要求JavaScript的实现必须支持Unicode 2.1 及后续版本,
ECMAScript 5 则要求支持Unicode 3及后续版本。

1. 区分大小写

JavaScript是区分大小写的语言。关键字、变量、函数名和所有的标识符都必须采取一致的大小写形式。

HTML不区分大小写,XHTML区分大小写。
许多客户端JavaScript对象和属性与它们所表示的HTML标签和属性同名。在HTML中,
这些标签和属性名可使用大写也可使用小写,在JavaScript中则必须是小写

例子:在HTML中设置事件处理程序时,onclick属性可以写成onClick,但在JavaScript代码(或者XHTML文档)中,必须使用小写的onclick。

2. 空格、换行符、格式控制符

JavaScript会忽略程序中标识之间的空格,多数情况下,也会忽略换行符。

由于可在代码中随意使用空格和换行,因此也采用整齐、一致的缩进来形成统一的编码风格,从而提高代码的可读性。

除了可识别普通的空格符(\u0020),JavaScript还可识别一些表示空格的字符:
水平制表符(\u0009)、垂直制表符(\u000B)、换页符(\u000C)、不中断空白(\u00A0)、字节序标记(\uFEFF),以及在Unicode中所有Zs类别的字符。
JavaScript将如下字符识别为行结束符:换行符(\u000A)、回车符(\u000D)、行分隔符(\u2028),段分隔符(\u2029)。
回车符加换行符在一起被解析为一个单行结束符。

Unicode格式控制字符(Cf类),比如*从右至左书写标记*(\u200F),*从左至右书写标记*(\u200E),控制着文本的视觉显示,这对一些非英语文本的正确显示来说至关重要。

这些字符可用在JavaScript的注释、字符串直接量和正则表达式直接量中,但不能用在标识符(比如变量名)中,但有个例外,零宽连接符(\u200D)和非零宽连接符(\uFEFF)可出现在标识符中,但不能作为标识符的首字符。

 3.Unicode转义序列

在有些计算机硬件和软件里,无法显示或输入Unicode字符全集。

为了支持那些使用老旧技术的程序员,JavaScript定义了一种特殊序列,使用6个ASCII字符来代表任意16位Unicode内码。

这些Unicode转义序列均以\u为前缀,其后跟随4个十六进制数(使用数字及大写或小写的字母A~F表示)。

这种Unicode转义写法可用在JavaScript字符串直接量、正则表达式直接量和标识符中(关键字除外)。

"café" === "caf\u00e9" // => true

Unicode转义写法也可出现在注释中

4.标准化

Unicode允许使用多种方法对同一个字符进行编码。

Unicode标准为所有字符定义了一个首选的编码格式,并给出了一个标准化的处理方式将文本转化为一种适合比较的标准格式,JavaScript会认为它正在解析的程序代码已经是这种标准格式,不会再对其标识符、字符串或正则表达式作标准化处理。

【注释】

合法的JavaScript注释:

//这是单行注释

/*这是一段注释*/ //这是另一段注释

/*
*这有是一段注释
*这里的注释可连写多行
*/

【直接量】

直接量(literal):程序中直接使用的数据值。

例子:
12 // 数字
1.2 // 小数
"hello world" // 字符串文本
"Hi" // 另一个字符串
true // 布尔值
false // 另一个布尔值
/javascript/gi // 正则表达式直接量(用做模式匹配)
null // 空
{ x:1 , y:2 } // 对象
[ 1,2,3,4,5,6 ] // 数组

【标识符和保留字】

1. 

标识符就是一个名字。在JavaScript中,标识符用来对变量和函数进行命名,或用做JavaScript代码中某些循环语句中的跳转位置的标记。

标识符必须以字母、下划线_或美元符$开始。
数字不允许作为首字符出现。

出于可移植性和易于书写的考虑,通常只使用ASCII字母和数字来书写标识符。

然而需注意,JavaScript允许在标识符中出现Unicode字符全集中的字母和数字。(从技术上讲,ECMAScript标准也允许在标识符的首字符后面出现Unicode字符集中的Mn类、Mc类和Pc类)。

由此,程序员也可使用非英语语言或数学符号来书写标识符。

JavaScript保留了一些标识符为自己所用。这些“保留字”不能用做普通的标识符。

2.
JavaScript把一些标识符拿出来用做自己的关键字。因此,不能在程序中把这些关键字用做标识符(不能用作 变量名/函数名,或某些循环语句中跳转位置的标记):
break、delete、function、return、typeof、case、do、if、switch、var、catch、else、in、this、void、continue、false、instanceof、throw、while、debugger、finally、new、true、with、default、for、null、try

JavaScript同样保留了一些关键字,在当前的语言版本中并没有使用,但在未来版本中可能会用到。ECMAScript 5保留了这些关键字:
class、const、enum、export、extends、import、super

有些关键字在普通的JavaScript代码中是合法的,但在严格模式下是保留字:
implements、let、private、public、yield、interface、package、protected、static

严格模式下,对下面标识符的使用做了严格限制,不能用做变量名、函数名或参数名:
arguments、eval

ECMAScript 3 将Java的所有关键字都列为自己的保留字,尽管这些保留字在ECMAScript 5 中放宽了限制,但如果希望代码能在基于ECMASscript 3 实现的解释器上运行的话,应避免使用下面这些关键字作为标识符:
abstract、double、goto、native、static、boolean、enum、implements、package、super、byte、export、import、private、synchronized、char、extends、int、protected、throws、class、final、interface、public、transient、const、float、long、short、volatile

JavaScript预定义了很多全局变量和函数,应当避免把它们的名字用做变量名和函数名:
arguments、encodeURI、Infinity、Number、RegExp、Array、encodeURIComponent、isFinite、Object、String、Boolean、Error、isNaN、parseFloat、SyntaxError、Date、eval、JSON、parseInt、TypeError、decodeURI、EvalError、Math、RangeError、undefined、decodeURIComponent、Function、NaN、ReferenceError、URIError

JavaScript的具体实现可能定义独有的全局变量和函数,每一种特定的JavaScript运行环境(客户端、服务器端等)都有自己的一个全局属性列表。

【可选的分号】

JavaScript使用分号(;)将语句分隔开。这对增强代码的可读性和整洁性非常重要。

关于JavaScript中可选分号的问题有些需要注意的细节:

a = 3;
b = 4;
两条语句用两行书写,第一个分号是可省略掉的

a = 3; b = 4;
这样格式的书写,第一个分号不能省略掉

JavaScript并不是在所有换行处都填补分号:只有在缺少了分号就无法正确解析代码的时候,JavaScript才会填补分号。

如果当前语句和随后的非空字符不能当成一个整体来解析的话,JavaScript就在当前语句行结束处填补分号。

JavaScript无法解析代码var a a ; 第二个a可和第三行内容一起解析成“a=3;”

var y = x + f
(a+b).toString( )

JavaScript会把这段代码看做:var y = x + f(a+b).toString( ); 而这段代码本意并不是这样。

通常来讲,如果一条语句以“(”、“[”、“/”、“+”、“-”开始,那么它极有可能和前一条语句在一起解析。
有些程序员喜欢保守地在语句前加上一个分号,这样如果之前的语句被修改了、分号被误删除了,当前语句还是会正确得解析:
var x = 0 // 这里省略了分号
;[x,x+1,x+2].forEach(console.log) // 前面的分号保证了正确的语句解析。

如果当前语句和下一行语句无法合并解析,JavaScript则在第一行后填补分号,这是通用规则,但有两个例外:

1.在涉及return、break和continue语句的场景中。如果这三个关键字后紧跟着换行,JavaScript则会在换行处填补分号。

即:在return、break、continue和随后的表达式之间不能有换行。
如果添加了换行,程序只有在极特殊的情况下才会报错,且程序的调试也非常不方便

2.在涉及“++”和“--”运算符时。这些运算符可作为表达式的前缀,也可当做表达式的后缀。
如果将其用做后缀表达式,它和表达式应当在同一行。否则,行尾将填补分号,同时“++”或“--”将会作为下一行代码的前缀操作符并与之一起解析:

后续待了解/研究(解决): ASCII,Latin-1,Unicode格式控制字符(Cf类),Unicode字符集中的Mn类、Mc类和Pc类……

扩展阅读:《Unicode与JavaScript详解》 阮一峰

笔记《JavaScript 权威指南》(第6版) 分条知识点概要1—词法结构的更多相关文章

  1. Note | javascript权威指南[第六版] 第2章:词法结构

      语法结构规定了诸如变量名是什么样的.怎么写注释,以及程序语句之间如何分隔等规则.本章用很短的篇幅来介绍JavaScript的词法结构.   2.1.字符集   JavaScript程序是用Unic ...

  2. 《JavaScript权威指南 第六版 中文版》(一)

    <JavaScript权威指南 第六版 中文版> 第二章 词法结构 2.1字符集 JavaScript是使用Unicode字符集编码写的. 2.1.1区分大小写 JavaScript是区分 ...

  3. javascript权威指南第6版学习笔记

    javascript权威指南第6版学习笔记 javascript数组.函数是特殊对象 看一点少一点. 3.1.4 hello.js内容是 var x=.3-.2;var y=.2-.1 console ...

  4. JavaScript权威指南(第6版)(中文版)笔记

      JavaScript权威指南(第6版)(中文版)笔记      

  5. 《JavaScript权威指南(第6版)(中文版)》PDF

    简介自1996年以来,JavaScript的:权威指南已为JavaScript圣经程序员,程序员指南和全面的参考,以核心语言和客户端JavaScript API的Web浏览器定义.第6版包括HTML5 ...

  6. 【JavaScript权威指南(第五版)】笔记之第一部分 核心javascript (第1章~第12章)

    第一章 javascript概述 ①.javascript是一种松散类型语言;也是一种解释型语言;         第二章 词法结构 ①.大小写敏感         第三章 数据类型和值 ①.isFi ...

  7. JS 语言核心(JavaScript权威指南第六版)(阅读笔记)

    前言: 对于程序员,学习是无止境的,知识淘换非常快,能够快速稳固掌握一门新技术,是一个程序员应该具备的素质.这里将分享本人一点点不成熟的心得. 了解一门语言,了解它的概念非常重要,但是一些优秀的设计思 ...

  8. JavaScript权威指南第六版(阅读笔记)

    前言: 对于软件行业学习是无止境的,因为知识更替非常快,能够快速稳固掌握一门新技术是一个程序员应该具备的基本素质. 了解一门语言,了解它的概念非常重要,但是一些优秀的设计思想需要细心和大量实践才能慢慢 ...

  9. [在读] javascript权威指南第六版

    耽搁了有大半年没看,记得当时看到5分之2了吧.权威指南是不管读几遍都能觉得有新收获的书^^

随机推荐

  1. maven中target不能访问

    原因是maven  clean的时候已经把target文件夹删除  但是文件夹还存在页面中  所以我们看得到但是不能打开.正常操作是获得管理员权限删除后再重新clean,但是我电脑有360,直接360 ...

  2. JavaScript笔记1———js的一些常识

    一.什么是js? js是一种运行于解释器中的解释型脚本语言. 二.js的组成部分? 1.ECMAScript-----这是js的核心 2.DOM-----让js可以对网页进行操作(例:对页面元素的增. ...

  3. CCF CSP 201809-1 卖菜

    题目链接:http://118.190.20.162/view.page?gpid=T79 问题描述 试题编号: 201809-1 试题名称: 卖菜 时间限制: 1.0s 内存限制: 256.0MB ...

  4. java0424 wen 集合框架2

  5. springBoot整合jpa

    https://blog.csdn.net/qq_35180973/article/details/82316438 总体来讲只是在service调用dao的时候用接口代替dao继承CrudRepos ...

  6. C# Winform ComBox三种赋值方式

    https://www.cnblogs.com/ingstyle/p/4815303.html 第一种方法: DataTable dt = new DataTable(); dt.Columns.Ad ...

  7. oracle基本查询

  8. Go-常见的面试题(一)

    文章转载地址:https://juejin.im/entry/5971bed66fb9a06bb21adf15 1.写出下面代码的输出 package main import "fmt&qu ...

  9. 删除链表的倒数第N个节点(java实现)

    题目: 给定一个链表,删除链表的倒数第 n 个节点,并且返回链表的头结点. 示例: 给定一个链表: 1->2->3->4->5, 和 n = 2. 当删除了倒数第二个节点后,链 ...

  10. 接口测试工具postman

    一. 安装 1. 免费官网链接:https://www.getpostman.com/postman,下载好后双击.exe程序安装即可 2. 注意事项:建议安装在非系统盘,即C盘以外的盘,路径最好用全 ...