一.文字处理 之前在练习爬虫时,常常爬了一堆乱七八糟的字符下来,当时就有找网络上一些清洗数据的方式,这边pandas也有提供一些,可以参考使用看看.下面为两个比较常见的指令,往往会搭配使用. split(“,”)可以将文字串分割,冒号里的为分割依据,左边的代码就是把两个冒号中间的文字串视为一个单元. strip()去除空白符号. 1.正则表达式 正则表达式为处理文字搜索匹配的功能,python可以直接导入re模块来使用.用法为下. 可直接用split来编译再拆解,也可以先用compile编译,再…