03

什么是统计误差?(上) 2024年07月18日 中国信息报

  ■ 余芳东 陶然

  减少统计误差,把统计误差控制在科学合理范围,是统计理论研究的重要内容,也是统计实践的重要方面。在统计生产过程中,减少各个环节统计误差,对确保数据真实准确、提高统计数据质量至关重要。

  一、基本概念

  统计误差也称统计数据误差,是统计工作实际获取数据结果与相应客观真值之间的差距。根据统计生产的主要过程,统计误差可分为设计误差、调查误差和整理误差,调查误差是统计误差的主要来源,实际工作中,如果不加特别说明,统计误差通常指的是调查误差。根据统计误差产生的原因,统计误差可分为抽样误差和非抽样误差。根据误差的表现形式,统计误差又可分为绝对误差与相对误差。

  二、统计误差产生的原因

  统计误差的产生原因多种多样,既有技术性因素引起的误差,例如统计方法不科学、统计指标设计不合理造成的误差;也有非技术性因素导致的误差,例如统计对象故意谎报,人为干扰统计工作造成的误差。统计误差产生的原因可以概括为抽样误差和非抽样误差。

  抽样误差是当采用随机原则从总体中抽取部分个体组成样本研究总体时,样本估计值与总体真值之间的差异。抽样误差是由样本抽取随机性导致的,而不是调查错误的结果,只要采用抽样调查,抽样误差就不可避免。全国大型抽样调查的抽样误差一般应控制在5%以内,才能保证调查结果的可靠性。例如,我国2016年“公众生态环境满意度”抽样调查的抽样绝对误差的控制目标在3%以内。

  非抽样误差是相对于抽样误差而言的,指除了抽样随机性以外,由于其他多种原因引起的调查结果与总体真值之间的差异。在抽样调查和全面调查(普查)中都可能存在非抽样误差,具体产生的原因包括:(1)全面调查中由于统计指标、统计分组、调查方法设计不周、调查对象范围界定不清而产生的涵盖误差;(2)抽样调查构造抽样框时,目标总体与抽样总体不一致所导致的抽样框误差;(3)由于被调查对象无回答造成的无回答误差;(4)统计人员填写调查表错误,以及数据录入、整理、处理等环节中存在错误所产生的计量误差。实践中,非抽样误差通常是上述全部或部分原因综合作用结果。

  三、如何正确理解统计误差

  统计误差是反映统计数据质量的重要指标。统计误差越大,准确性越低,统计数据质量越差;统计误差越小,准确性越高,统计数据质量越好。

  首先,统计误差可以作为评判一项调查结果是否准确可靠的重要依据。当统计误差被控制在可接受范围内时,统计推断的结果才有意义。例如,我国2016年“公众生态环境满意度”抽样调查在省级层面的绝对误差低于3%的控制目标,据此可认为抽样方案设计科学、合理,样本具有良好的代表性,估计精度能够同时满足全国和省级层面的数据使用需要。

  其次,统计误差可以作为对比统计数据质量的重要依据。例如,全国农业普查公报显示,数据填报综合差错率已经由1996年第一次普查的4.9‰下降为2016年第三次普查的3.3‰。这说明我国农业普查经过二十年的实践探索,数据质量在稳步提高。

  (摘自《领导干部统计知识问答》(第二版),中国统计出版社)

本期报纸需要付费才能阅读,请您去网站购买