一.背景:在爬取网络小说生成的文件中,发现有些空格没法替换,使用十六进制编辑器查看,发现这些空格字符的十六进制值是“c2a0”,其来源是网页控制的特殊字符,这是一个叫做Non-breaking space的东西,用于阻止在此处自动换行和阻止多个空格被压缩成一个.就是 . 二.替换的有效方法:使用str.replace(u'\xa0',u'')命令即可 三.示例(1)原始文件:1.txt显示如下:(每一行前面都有四个“c2a0”,显示为4个空格,即显示?之处)(base) [python@