之前发过一篇关于定位csv中的特殊字符的,主要是用到了python的自带的函数,近期又遇到了一些新的问题,比如isdigit()的缺点在于不能判断浮点型,以及小数中有多个小数点的情况.发现还是正则表达式更灵活一些. import pandas as pd import numpy as np import csv import re def is_chinese(uchar): if u'\u4e00' <= uchar <= u'\u9fff': return True else: retu…