可疑测定值在一组平行测定数据中,常会出现与其他结果相差较大的个别测定值,该值称为可疑值或异常值(也叫离散值或者极端值等)。对于位数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响。[2] 如果已经测定中发生过失,则无论此数据是否异常,一概都应舍去;而在原因不明的情况下,就必须按照一定的统计学方法进行检验,然后再对取舍做出判断。以下介绍使用简单的Q检验法和效果好的格鲁布斯法。[2] Q检验法 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | Q0.90 | 0.94 | 0.76 | 0.64 | 0.56 | 0.51 | 0.47 | 0.44 | 0.41 | Q0.95 | 0.97 | 0.84 | 0.73 | 0.64 | 0.59 | 0.54 | 0.51 | 0.49 |
[2]该法有迪安和狄克逊在1951年提出。具体步骤:[2] 1、将一组数据有小至大按顺序排列为x1,x2,x3…xn-1,xn,假设x1和或xn为可疑值。[2] 2、计算可疑值与最邻近数据的差值,除以极差,所得的商称为Q值。[2] 若x1为可疑值,则:[2] Q=(x2-x1)/(xn-x1)[2] 若xn为可疑值,则:[2] Q=(xn-xn-1)/(xn-x1)[2] 例题: 用冷原子荧光法测定水中汞的含量,3次测定的结果分别为:0.001mg/L、0.002mg/L、0.009mg/L。问置信度为90%时,可疑数据“0.009”是否应舍去?[2] 解:[2] Q=(0.009-0.002)/(0.009-0.001)=0.88[2] 置信度为90%,n=3时,查表得:Q=0.94[2] 因为:Q<Q表,所以0.009mg/L这个数据不应该舍去。[2] 若将”0.009“保留,取三次测定数据的平均值,分析结果不合理,若再测定一次数据得0.002mg/L,[2] 此时,Q表=0.76,Q>Q表,故可以舍去可疑值0.009[2] 格鲁布斯发测定次数n | 置信度P | 测定次数n | 置信度P | 95% | 99% | 置信度P95% | 99% | 3 | 1.15 | 1.15 | 12 | 2.29 | 2.55 | 4 | 1.46 | 1.49 | 13 | 2.33 | 2.61 | 5 | 1.67 | 1.75 | 14 | 2.37 | 2.66 | 6 | 1.82 | 1.94 | 15 | 2.41 | 2.71 | 7 | 1.94 | 2.10 | 16 | 2.44 | 2.75 | 8 | 2.03 | 2.22 | 17 | 2.47 | 2.79 | 9 | 2.11 | 2.32 | 18 | 2.50 | 2.82 | 10 | 2.18 | 2.41 | 19 | 2.53 | 2.85 | 11 | 2.23 | 2.48 | 20 | 2..56 | 2.88 |
[2]首先计算出改组数据的平均值x和标准偏差s,再计算统计量G:[2] G=Ix疑-xI/s[2] 根据事先确定的置信度和测定次数查阅表4-6的G值表,如果G>G表,说明可疑值相对于平均值偏离较大,应以一定的置信度将其舍去,否则应予以保留。[2] 在运用格鲁布斯法判断可疑值的取舍时,由于引入了t分布中最基本的两个参数平均值和方差,故该方法的准确度较Q检验法高。[2]
|