概述 自然语言是非常复杂多变的,计算机也不认识咱们的语言,那么咱们如何让咱们的计算机学习咱们的语言呢?首先肯定得对咱们的所有文字进行编码吧,那咱们很多小伙伴肯定立马就想出了这还不简单嘛,咱们的计算机不都是ASCII编码的嘛,咱直接拿来用不就好啦?我只能说too young too simple.咱们的计算机只是对咱们的“字母”进行ASCII编码,并没有对咱们的“Word”编码.world应该是咱们处理自然语言的最基本的元素,而不是字母.那么世界上有千千万万的Word,咱们具体怎么表示呢?就算找出