自然语言处理和图像处理不同,作为人类抽象出来的高级表达形式,它和图像.声音不同,图像和声音十分直觉,比如图像的像素的颜色表达可以直接量化成数字输入到神经网络中,当然如果是经过压缩的格式jpeg等必须还要经过一个解码的过程才能变成像素的高阶矩阵的形式,而自然语言则不同,自然语言和数字之间没有那么直接的相关关系,也就不是那么容易作为特征输入到神经网络中去了,所以,用神经网络处理自然语言,不可避免的在数据预处理方面更加繁琐,也更加细致!自然语言处理的另外一个不同之处在于语言之间的相关关系,举一个最简单…