2024年5月1日发(作者:)
试验数据取舍的方法及应用探讨
一、试验数据进行取舍的必要性
在公路工程试验检测过程中采集的各种样本数据往往或多或少存在异常值
或错误值。这些异常值或错误值主要来源于人为和非人为的因素,包括检测人员
的误操作、仪器设备的偶然故障以及其他偶然的因素。由于这些异常值或错误值
的存在,使得我们所采集的数据不能够客观反映检测路段的质量,特别是采用评
定值进行判定时尤其突出。笔者通过长期的检测工作发现在检测路段进行评定时
某一个单值的取舍往往影响到整个评定路段的结果,从而影响到对整个工程质量
的判断。因此有必要对所采集的数据进行判别采取科学的方法进行合理的取舍。
二、试验数据的取舍方法
对试验数据的取舍可以采用数理统计的方法,按一定的保证率对数据进行取
舍,一般有拉依达法、肖维纳特法和格拉布斯法,再次对三种方法介绍如下:
1) 拉依达法。当试验次数较多时,可简单的用3倍标准差作为可疑数据取
舍的标准,即:
——某一试验数据
——试验数据算术平均值
S——试验数据标准差
根据随机变量的正态分布, 的概率为99.73%,在此范围之外的概率为0.27%
这种小概率事件出现的可能性极小。因此在试验数据中一旦出现就认为是不可靠
的,应当舍弃。
2) 肖维纳特法。进行n次试验,其测量值服从正态分布,以概率 设定一
判定范围 ,当偏差( )超出该范围则意味着 是可疑的应当舍弃。
——概率为 系数
——某一试验数据
——试验数据算术平均值
S——试验数据标准差
3) 格拉布斯法。假设试验数据按正态分布,根据顺序统计量来确定可疑数
据的取舍。将n个试验数据 , ,…, 按从小到大顺序重新排列,根据顺序统计
原则给出标准化顺序统计量g:
当 可疑时:
当 可疑时:
根据格拉布斯统计量的分部,在指定的显著性水平β(一般为0.05)下,求
得可疑值的临界值 ,格拉布斯法判别标准为:
——试验数据算术平均值
——参与计算数据的最小值
——参与计算数据的最大值
S——试验数据标准差
β——指定的显著性水平
n¬——参与计算的数据数量
g——标准化顺序统计量
——标准化顺序统计量在一定显著性水平下的临界值可查表求得
利用格拉布斯法每次只能舍去一个可疑值,有多个可疑值时应一个一个舍去,
每舍去一个n=n-1,以此为基础判别下一个可疑数据。
三、试验数据取舍的工程应用
上述三种进行可疑值取舍的方法舍弃范围均可以写成 范围以外的测定值,
只是在系数k的取值上有所不同,这与《公路路基路面现场测试规程》(JTG E40-
2007)附录B 检测路段数据整理方法 是一致的,该规程规定当无特殊规定时,
可疑数据的舍弃宜按照 K倍標准差作为舍弃标准,即在资料分析当中,舍弃那
些在 范围以外的测定值,然后再重新计算整理。当试验数据N为3、4、5、6个
时,k值分别为1.15、1.46、1.67、1.82,N 7时,k值宜采用3。K值采用3即
拉依达法。因肖维纳特法判定范围仅与数据数量n有关与保证率无关工程实际
应用效果不好,在此仅以工程实例对拉依达法和格拉布斯法进行讨论。
该工程为尚未通车的新建I级公路采用沥青混凝土面层,按照世界几个权威
机构的研究结果(见表2),及对路面平整度检测的经验,并结合工程实际情况,
可判断表1-1至表1-6中加粗的数据为明显的异常数据。
IRI与路面服务性能的关系
由表3-1可以看出,在异常值不剔除的情况下进行计算,计算结果受异常值
的影响,各评定单元的计算结果标准差及变异系数均较大,试验结果的离散性大
变异性高,与实际情况不符,容易造成对工程质量的误判。表3-2的计算采用了
拉依达法按3倍标准差进行了剔除,试验结果的离散性减小变异性降低,与实际
情况较符合,但由于拉依达法自身的缺点某些异常数据(如10.04等数据)不能
被剔除,不能达到较理想的状态,因此该方法适合于要求不太严格的场合。表3-
3的计算采用格拉布斯法对可疑值进行舍弃,该方法能够较好的对异常值进行剔
除从而更加减小异常值的影响,从计算结果可以看出各评定路段标准差、变异系
数均较小,最符合实际情况。再结合表4的计算结果,采用格拉布斯法剔除异常
数据后整条路的变异性均降到最低,与实际情况相符合,能客观反映该路面的平
整度。
四、结论
在试验检测过程中所产生的异常数据如果不剔除会产生错误的结果,从而造
成对工程质量的误判。有必要采取科学的手段对异常数据进行舍弃。运用拉依达
法与格拉布斯法对异常数据进行舍弃均有较好的效果,尤其以格拉布斯法最佳,
但数据的舍弃均有一定概率的风险,所以对舍弃的数据要分析原因并加以验证,
这样才能够确保试验检测数据能够客观地反映工程质量。
发布者:admin,转转请注明出处:http://www.yc00.com/web/1714493979a2457230.html
评论列表(0条)