1)正态分布数据,飘出95%的可能是异常值.变量var正态标准化,|var|<=1.96的可能是异常值,further chk needed!large sample better. 对于偏态分布的数据(histogram chk),这个方法貌似不是很好. 2)Boxplot Method 稳健,无正态分布假设. 箱线图判断异常值的标准以四分位数和四分位距为基础. 四分位距(QR, Quartile range):上四分位数与下四分位数之间的间距,即上四分位数减去下四分位数. F代表中位数,QR…