搜索结果: GB/T 4883-2008, GB/T4883-2008, GBT 4883-2008, GBT4883-2008
| 标准编号 | GB/T 4883-2008 (GB/T4883-2008) | | 中文名称 | 数据的统计处理和解释 正态样本离群值的判断和处理 | | 英文名称 | Statistical interpretation of data -- Detection and treatment of outliers in the normal sample | | 行业 | 国家标准 (推荐) | | 中标分类 | A41 | | 国际标准分类 | 03.120.30 | | 字数估计 | 27,286 | | 发布日期 | 2008-07-16 | | 实施日期 | 2009-01-01 | | 旧标准 (被替代) | GB/T 4883-1985 | | 引用标准 | GB/T 4882-2001; GB/T 19000-2000; ISO 3534-1-2006; ISO 3534-2-2006 | | 标准依据 | 国家标准批准发布公告2008年第12号(总第125号) | | 发布机构 | 中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会 | | 范围 | 本标准适用于来自正态分布的样本中离群值的判断和处理。 |
GB/T 4883-2008
Statistical interpretation of data.Detection and treatment of outliers in the normal sample
ICS 03.120.30
A41
中华人民共和国国家标准
GB/T 4883-2008
代替GB/T 4883-1985
数据的统计处理和解释
正态样本离群值的判断和处理
2008-07-16发布
2009-01-01实施
中华人民共和国国家质量监督检验检疫总局
中国国家标准化管理委员会发布
目次
前言 Ⅲ
引言 Ⅳ
1 范围 1
2 规范性引用文件 1
3 术语、定义和符号 1
3.1 术语和定义 1
3.2 符号和缩略语 1
4 离群值判断 2
4.1 来源与判断 2
4.2 离群值的三种情形 2
4.3 检出离群值个数的上限 2
4.4 单个离群值情形 2
4.5 判定多个离群值的检验规则 2
5 离群值处理 2
5.1 处理方式 2
5.2 处理规则 3
5.3 备案 3
6 已知标准差情形离群值的判断规则 3
6.1 一般原则 3
6.2 离群值的判断规则 3
6.2.1 上侧情形 3
6.2.2 下侧情形 3
6.2.3 双侧情形 3
6.3 使用奈尔(Nair)检验法的示例 4
7 未知标准差情形离群值的判断规则(限定检出离群值的个数不超过1时) 4
7.1 一般原则 4
7.2 格拉布斯(Grubbs)检验法 4
7.2.1 上侧情形 4
7.2.2 下侧情形 4
7.2.3 双侧情形 5
7.2.4 使用格拉布斯(Grubbs)检验法的示例 5
7.3 狄克逊(Dixon)检验法 5
7.3.1 单侧情形 5
7.3.2 双侧情形 6
7.3.3 使用狄克逊(Dixon)检验法的示例 6
8 未知标准差情形离群值的判断规则(限定检出离群值的个数大于1时) 6
8.1 一般原则 6
8.2 偏度-峰度检验法 6
GB/T 4883-2008
8.2.1 使用条件 6
8.2.2 单侧情形---偏度检验法 7
8.2.3 双侧情形---峰度检验法 7
8.2.4 重复使用峰度检验法的示例 7
8.3 狄克逊(Dixon)检验法 8
8.3.1 狄克逊(Dixon)检验法的规则 8
8.3.2 重复使用狄克逊(Dixon)检验法的示例 8
附录A(规范性附录) 统计数值表 10
附录B(资料性附录) 选择离群值判断方法和处理规则的指南 15
B.1 判定和处理离群值的目的 15
B.2 对各种检验法的选择 15
B.3 重视检出的离群值给出的信息 16
附录C(资料性附录) 当狀>30时的狄克逊(Dixon)检验 17
参考文献 21
GB/T 4883-2008
前言
本标准代替GB/T 4883-1985。本标准与GB/T 4883-1985相比较,技术内容的变化主要包括:
---增加了术语、定义和符号一章;
---将“正态样本异常值的判断和处理”改为“正态样本离群值的判断和处理”;
---将术语“检出异常值”和“高度异常值”分别改为“歧离值”和“统计离群值”,并进一步明确了二
者的含义及相互差异;
---增加了检出水平和剔除水平的定义;
---检出水平由原标准中“检出水平α一般取为1%,5%或10%”改为“除非根据本标准达成协议
的各方另有约定外,α值应为0.05”;
---明确规定剔除水平α为“除非根据本标准达成协议的各方另有约定外,α值应为0.01”;
---增加了各种情形“统计离群值”的检验步骤;
---将“没有异常值”和“没有高度异常的离群值”分别改为“未发现离群值”和“未发现统计离群
值”;
---增加了奈尔(Nair)统计量、格拉布斯(Grubbs)统计量、狄克逊(Dixon)统计量、偏度统计量、峰
度统计量的符号;
---作狄克逊(Dixon)检验时,将样本量由30扩充到100,此内容作为附录C。
本标准的附录A为规范性附录,附录B和附录C为资料性附录。
本标准由中国标准化研究院提出。
本标准由全国统计方法应用标准化技术委员会归口。
本标准起草单位:中国标准化研究院、中国科学院数学与系统科学研究院、宁波工程学院、北京大
学、无锡市产品质量监督检验所、北京师范大学。
本标准主要起草人:于振凡、丁文兴、陈敏、荆广珠、房祥忠、吴建国、崔恒建、陈玉忠。
本标准所代替标准的历次版本的发布情况为:
---GB/T 4883-1985。
GB/T 4883-2008
引 言
从事科学研究、工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不
开统计方法。统计学是研究数字资料的整理、分析和正确解释的一门学科。人们各自从不同的来源取
得各种数字资料,这些数字资料通常都是杂乱无章的,必须经过整理和简缩才能利用,使用完善的统计
方法就可使数据整理、排列的有条有理,用图形或少量的几个重要参数,就可把一大堆数据的特征表达
出来,这样既可避免不正确的解释,又可将获得满意数据的成本降到最低限度,提高了经济效益。《数据
的统计处理和解释》含有多项国家标准,它们是:
---统计容忍区间的确定(GB/T 3359)
---均值的估计和置信区间(GB/T 3360)
---在成对观测值情形下两个均值的比较(GB/T 3361)
---二项分布参数的估计与检验(GB/T 4088)
---泊松分布参数的估计与检验(GB/T 4089)
---正态性检验(GB/T 4882)
---正态样本离群值的判断和处理(GB/T 4883)
---正态分布均值和方差的估计与检验(GB/T 4889)
---正态分布均值和方差检验的功效(GB/T 4890)
---Ⅰ型极值分布样本离群值的判断和处理(GB/T 6380)
---伽玛分布 (皮尔逊Ⅲ型分布)的参数估计(GB/T 8055)
---指数分布样本离群值的判断和处理(GB/T 8056)
对于《数据的统计处理和解释 正态样本离群值的判断和处理》尚无相应的国际标准,但在一些关
于测量的国际标准和技术文件中(例如:ISO 5725《测量方法与结果的准确度》、ISO 导则98《用蒙特卡
罗方法评定不确定度》)都采用了本标准中规定的一些正态样本离群值的判断和处理的方法。
GB/T 4883-2008
数据的统计处理和解释
正态样本离群值的判断和处理
1 范围
本标准适用于来自正态分布的样本中离群值的判断和处理。
2 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有
的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究
是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 4882-2001 数据的统计处理和解释 正态性检验
GB/T 19000-2000 质量管理体系 基础和术语
ISO 3534-1:2006 统计学词汇及符号 第1部分:一般统计术语与用于概率的术语
ISO 3534-2:2006 统计学词汇及符号 第2部分:应用统计
3 术语、定义和符号
ISO 3534-1:2006、ISO 3534-2:2006和GB/T 19000-2000确定的术语和定义以及下列术语、定义
和符号适用于本标准。为便于参考,某些术语直接引自上述标准。
3.1 术语和定义
3.1.1
样本中的一个或几个观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体。
注:离群值按显著性的程度分为歧离值和统计离群值。
3.1.2
在剔除水平下统计检验为显著的离群值。
3.1.3
在检出水平(3.1.4)下显著,但在剔除水平(3.1.5)下不显著的离群值。
3.1.4
为检出离群值而指定的统计检验的显著性水平。
注:除非......
|