用假设检验对自动站和人工站数据进行检验分析

2022-09-12

所谓自动气象站, 是指能按设定的要求, 对多种气象要素自动进行采集、处理、存储和传输的地面气象观测设备, 可以减少观测人员的地面观测工作量, 提高观测时效和质量。自20世纪80年代以来, 芬兰、美国、日本等许多国家的地面气象观测网中就已普遍采用了自动气象站[1]。我国自动气象站的研制已有近40年的历史, 20世纪90年代末, 我国自行研制的自动气象站已经开始投入业务使用。迄今全国气象台站地面观测要素中的器测项目基本上由自动测量替代, 这标志着我国地面气象观测进入一个新时代[2]。而目测项目的自动观测仪器目前研究进展也比较迅速, 由解放军理工大学高太长教授等人研制的红外线测云仪, 从展示的产品图片来看, 观测到的云状逼真清晰, 分辨率高。确信在不远的将来, 所有目测项目的观测都将用自动仪器替代。

根据中国气象局业务主管部门的要求, 新建自动气象站正式投入业务运行后, 要与人工气象站进行两年的对比观测。因此有必要就对比观测期间自动采集到的数据和人工观测的数据进行检验分析。

1 资料来源及台站概况

资料采用乌鲁木齐市大西沟气象站自动站与人工站第一阶段对比观测的数据中, 选取2008年1月、4月、7月、10月人工观测和自动站采集的压、温、湿数据, 参与检验的要素为08时、14时、20时的气温、本站气压、水汽压和相对湿度, 以及日最低最高气温和日最低最高气压。该站2007年7月安装ZQZ-CⅡ型自动气象站, 2007年12月31日20时正式投入业务运行, 2008年为对比观测的第一阶段, 该站位于乌鲁木齐河源一号冰川旁, 海拔3543.0米, 年平均气温-5.1℃, 最高气温19.6℃, 最低气温-36.4℃, 多年平均降水量458.4毫米。

2 检验及结果分析

2.1 资料处理

从理论上讲, 人工观测数据和自动站采集数据是成对的, 应该采用成对数据的T检验 (假设检验的一种方法) , 但由于自动站和人工站在获取数据时存在着这样四种差异:仪器原理差异、时空差异、样本差异、时次差异。这样就不能直接采用成对数据的T检验, 需要对数据进行处理, 即求算出同一要素人工站数据和自动站数据的差值, 转换成一组新的数据样本, 假设新的数据样本服从正态分布, 这样就将原来两个正态总体参数的差异性检验转换成单个正态总体参数的差异性检验问题。

2.2 检验方法及步骤

气象要素的观测值是受外界环境随机变化的, 所以无法事先确定某一要素 (样本) 的总体方差ó2, 故采用T检验法, 用双侧检验[3], 步骤如下:

(1) 建立原假设H0:u=u0 (常数, 实际计算时取u0=0, 即假设差值的均值为0) , 备择假设H1:u≠u0。

(2) 当H0成立时, 把u用u0代之, 则有:

式中T不含未知参量, 可作为H0的检验统计量。

(3) 选定显著性水平a, 由T分布的临界值表可查得自由度为n-1的临界值ta (n-1) , 使其满足P{|T|≥ta (n-1) }=a, 于是H0的拒绝域为|t|≥ta (n-1) 。

(4) 由样本值x1, x2, …, xn计算出统计量T的观察值t。

(5) 判断:比较|t|与ta (n-1) .若|t|≥ta (n-1) , 则拒绝H0, 否则不拒绝H0。

如果假设检验的结果接受原假设, 我们就认为自动采集的数据和人工观测的数据无显著性差异, 否则, 二者就存在差异。

2.3 计算统计量T的观察值t

对计算的过程这里不再赘述, 只将统计量T的观察值t的计算结果列于下列各表。

2.4 检验分析

2.4.1 确定拒绝域

分析前首先确定拒绝域, 由于4月份各要素差值的样本个数为30个, 1、7、10月份各要素差值的样本个数为31个, 取a=0.05, 查T分布表的ta (n-1) , 所查结果分别为:t0.05 (30-1) =2.4052, t0.05 (31-1) =2.0423。所以, 4月份各要素样本的拒绝域为:|t|>2.4052;1、7、10月份各要素样本的拒绝域为:|t|>2.0423。

2.4.2 检验结果

4月份各要素差值样本的拒绝域为:|t|>2.4052, 表1到表4中4月份满足原假设H0的要素有:08时、20时的气温;20时的本站气压和最高气压;14时的相对湿度;14时的水汽压。

1、7、10月份各要素差值样本的拒绝域为:|t|>2.0423, 表1到表4中1月份满足原假设H0的要素有:08时的气温和最高气压;7月份满足原假设H0的要素有:14时、20时的气压和最高气压;10月份满足原假设H0的要素有:14时、20时的气压和最高气压。

对检验的结果进行统计:气温有20组样本参与检验, 有3组样本达到显著水平, 显著率达:15%;气压有20组样本参与检验, 有9组样本达到显著水平, 显著率达:45%;相对湿度有12组样本参与检验, 仅有1组样本达到显著水平, 显著率达:8.3%;水汽压有12组样本参与检验, 仅有1组样本达到显著水平, 显著率仅达:8.3%。参与检验的总样本数为64组, 有14组达显著水平, 总显著率达21.9%。

3 结语与讨论

通过对乌鲁木齐市大西沟气象站人工数据和自动站数据的差值进行假设检验分析, 对参与检验的气温、气压、相对湿度及水汽压四个要素共64组数据样本进行显著性检验, 结果仅有14组数据样本达到显著水平, 显著率达21.9%。其中气温有20组样本参与检验, 有3组样本达到显著水平, 显著率达:15%;气压有20组样本参与检验, 有9组样本达到显著水平, 显著率达:45%;相对湿度有12组样本参与检验, 仅有1组样本达到显著水平, 显著率为:达8.3%;水汽压有12组样本参与检验, 仅有1组样本达到显著水平, 显著率达:8.3%。

以上检验结果表明:乌鲁木齐市大西沟站人工和自动站第一阶段的对比观测中人工观测的数据和自动站观测的数据存在着显著差异。

摘要:根据乌鲁木齐市大西沟气象站人工气象站和自动气象站第一阶段对比观测的数据中, 分别选取1月、4月、7月、10月份08时、14时、20时的气温、本站气压、水汽压和相对湿度, 以及日最低最高气温和气压, 并求算出同一要素人工数据和自动站数据的差值, 组成新的数据样本后进行假设检验分析, 其检验结果为:对参与检验的64组数据样本中, 只有14组数据样本通过信度为95%的显著性检验, 显著率达21.9%。其中, 气温有20组数据样本参与检验, 有3组数据样本达到显著水平, 显著率达15%;气压有20组数据样本参与检验, 有9组数据样本达到显著水平, 显著率达45%;相对湿度有12组数据样本参与检验, 仅有1组数据样本达到显著水平, 显著率达8.3%;水汽压有12组数据样本参与检验, 仅有1组数据样本达到显著水平, 显著率仅达8.3%。其结果表明:人工观测数据和自动站采集数据存在明显差异。

关键词:假设检验,人工站,自动站,对比观测,数据样本

参考文献

[1] 高太长, 刘西川, 刘磊, 等.自动气象站及气象传感器发展现状和前景分析[J].仪器仪表学报, 2008, 29 (8) :109~112.

[2] 胡玉峰, 李建国, 李平, 等.自动气象站原理与测量方法[M].北京:气象出版社, 2004:131~142.

[3] 杜晓林, 王玉民, 白荣凤, 等.概率论与数理统计[M].北京:气象出版社, 2005:145~170.

上一篇:痛性眼肌麻痹综合症20例临床分析下一篇:溴硝醇蒸馏过程物料热稳定性研究