错误信息:UnicodeDecodeError: ‘XXX' codec can't decode bytes in position 2-5: illegal multibyte sequence 这是因为遇到了非法字符,例如:全角空格往往有多种不同的实现方式,比如\xa3\xa0,或者\xa4\x57,这些字符,看起来都是全角空格,但它们并不是“合法”的全角空格真正的全角空格是\xa1\xa1,因此在转码的过程中出现了异常. 而之前在处理新浪微博数据时,遇到了非法空格问题导致无法正确解析数据…