统计调查数据质量控制研究

来源:专题 时间:2016-08-11 09:36:57 阅读:

【www.zhuodaoren.com--专题】

统计调查数据质量控制研究(一)
统计数据质量控制研究

龙源期刊网 .cn

统计数据质量控制研究

作者:陈海平 毕翠芬

来源:《经济研究导刊》2014年第13期

摘 要:统计数据的质量是统计工作的生命线。准确可靠的统计数据是国家、企业进行科学决策和科学管理的重要依据。要提高统计数据的质量,就要分析中国政府统计数据质量问题的特殊性,制定统计数据质量的衡量标准,并提出相应的对策和措施。

关键词:统计数据;质量控制;对策

中图分类号:F230 文献标志码:A 文章编号:1673-291X(2014)13-0175-02

统计是将原始数据整理转化为二次加工数据或信息的一个过程。数据(data)是为反映客观世界而记录下来的可以鉴别的数字或符号,如数字、文字、图形、图像、声音等。统计数据质量,是数据的一组品质标志满足用户需求的能力的综合。在这个定义中,质量的主体是数据,质量的客体是用户,质量控制的本质就是主体满足客体的能力的综合。经济越发展,统计越重要,近年来,中国统计数据质量虽然提高很快,但部分统计数据的真实性仍受到社会多方面的质疑。如何从体制上、制度上、机制上采取措施,提高中国统计数据质量,树立政府统计权威,便成为众多统计理论工作者和实际工作者探讨的重要理论和现实课题。

一、统计数据质量内涵

统计数据的质量主要指统计数据的准确性。准确可靠的统计数字,是进行科学决策和科学管理的重要依据,更是把握经济走向的有效分析工具。中国在经历金融危机之后,经济在震荡中稳步回升,在这新经济环境的刺激下,统计工作需求量大增。同时,社会公众对统计数据质量的要求也进一步提高。关于统计数据质量内涵主要包括以下几个方面:一是核心质量。核心质量是提供给数据使用方的最基本的效用或能力,也是控制统计数据质量的基础和中心内容。核心质量包括两个最基本的要素特征,即真实性和时效性。数据采集、核算、传递的真实性、可靠性,是统计数据质量的生命之本,关系到统计本身存在的价值;时效性、及时性是统计数据质量的活力之源,关系到统计数据自身的价值和效力。二是形式质量。形式质量是核心质量的重要保障,主要体现在统计法规、制度、标准是否健全完善,统计的内外部环境是否健康,统计指标体系是否科学等等。形式质量控制的目的在于基本地实现和维持核心质量对于数据使用方的基础满足能力。三是附加质量。附加质量是核心质量的扩展和延伸,往往需要借助内外部环境和条件的改革或改善才得以实现,如组织运行机制的改革,或者通过统计信息自动化建设,或者采用新的统计技术、统计工具等,都可能带来统计管理体制的变革,进而带动统计数据核心质量和形式质量的“质”的飞跃。这三个方面是相互促进、相互联系的一个整体。

二、统计数据质量的衡量标准

统计调查数据质量控制研究(二)
统计调查数据的质量控制

浅谈统计调查数据的质量控制

摘要:本文通过对统计数据的质量,这一概念的深入理解以及对其重要性的认识,提出了统计调查数据的质量控制现存的难点以及相应的解决方法。

关键词:概念难点解决方案

一、统计数据质量含义

所谓统计数据,就是将用户需要调查的某方面的一些相关信息,通过数据的形式统计起来。而统计数据质量,就是对所统计出来的这些数据的认可度。因为,有些统计数据和实际的情况存在着较大的差异。我们之所以进行数据统计,是因为想要真实的了解一些情况,从而能够进行重要的决定。因此,统计数据质量的好坏显得非常重要。

二、当前统计调查数据质量控制存在的缺陷

统计数据质量对于统计来说就像是树根对于树。如果统计数据质量不能达到理想的标准,就没有所谓的统计了。改革开放以来,随着经济社会的不断发展,统计数据质量的控制越来越难以保证,有以下几方面的难点:

(一)数据的源头难以控制

统计数据的数据来源应该是我们根据用户的需求,通过各种方式进行采集的数据。在采集的过程中,理应是对符合要求的特定的人群进行的采集,而且特定人群所给出的数据应该具有真实性。但是在这一过程中,往往会出现不可避免的主观因素和客观因素。比如

统计调查数据质量控制研究(三)
中国政府统计数据质量研究

中国政府统计数据质量研究:一个文献综述

赵学刚,王学斌,刘康兵 2011-03-23

摘 要: 近年来,中国政府数据统计质量问题日益受到国内外学者的关注,相应的研究文献大量涌现,研究

主要集中在统计数据质量的含义和衡量标准、统计数据失真的作用机理、统计数据质量控制技术、评估方法和管理理论,同时还有针对中国统计数据质量进行实证方面的评估以及改进统计数据质量的政策建议方面的讨论。本文在回顾现有文献基础上,指出要从根本上解决我国政府统计数据失真问题,还得从改革现行的统计管理体制入手,摆脱地方政府干扰,确保统计独立性,同时认为在现行框架下增加诸如消费价格指数权重、房屋销售价格及房价指数、固定资产投资等指标的统计透明度可以在很大程度上避免当前很多对中国政府统计数据不必要和不公正的质疑。

关键词: 统计数据,数据质量,理论研究,经验证据

一、引言

2010年2月25日,国家统计局发布的《2009年国民经济和社会发展统计公报》显示,2009年全国70个大中城市房屋销售价格上涨1.5%。而根据2010年1月19日国家统计局公布的2009年全国房地产市场数据,相比前一年均价上涨约24%。2009年广大居民普遍感觉房价疯涨,出于与实际感觉的巨大反差,网民对当年“70个大中城市房屋销售价格上涨1.5%”的数据提出了大量质疑。国家统计局城市司2010年2月28日不得不公布了该数据的统计调查方案予以回应,以说明两套数据计算方法的差异。

其实中国政府统计数据质量问题一直存在,早在1988年Perkins就提出了中国经济增长率可能存在上偏误差的问题。2001年美国匹兹堡大学Rawski教授先后发表两篇文章,几乎是全方位地对官方公布的中国经济增长数据表示高度的质疑(Rawski,2001a,2001b)。这一论断与著名的美国经济学家克鲁格曼(Paul Krugman)此前的疑虑遥相呼应,素有“国际经济乌鸦”之称的他曾经说过,“中国经济数据,是一堆不可置信的符号体系。看中国的经济增长数据,就像看一部科幻小说。”2002年,中国经济改革研究基金会国民经济

研究所副所长王小鲁针对我国经济增长统计的准确性指出了两个“正常”和两个“不正常”,即二十世纪八九十年代以来我国经济结构的调整和生产效率的提高导致“经济增长快于能源增长应当是正常的,但经济增长在某些时间段或某些年份与能源增长发生找不到原因的重大偏离甚至反向变动,是不正常的”;经济体制改革导致“综合要素生产率的一定程度上升是正常的,而没有原因的突然大幅度跃升是不正常的”。关于消费价格指数(CPI)、平均工资、房价、失业数据、城镇化数据、居民收入数据、第三产业数据、房地产投资等统计数据被国家统计局搞得一片纷乱,经常存在不一致性,很难让人信服。最近,中国统计数据体系正在受到越来越多的质疑和拷问。随着中国经济结构的转型,我国的统计体系要从以制造业特别是工业生产为主的统计调整到涵盖商品消费、服务业、城市化水平等指标在内的全方位统计。

改革三十多年来,中国的统计体系已经发生了很大的变化,统计部门也做出了很多努力。但总体看来,统计体系严重滞后于经济发展现实,统计工作显然还有更大的改进余地,而且当下更显迫切。中国下一步要改善经济增长质量、改善宏观经济决策、进一步深入改革和完善市场经济体制,其中一个很重要的环节就是要改革现有的经济统计体系,这就必须要涉及到统计部门的改革。由于现有的关于这个主题的文献很多,评述所有学者的贡献几乎是一件不可能完成的事情,因此,笔者只回顾了其中极具影响力的文献(当然,疏漏也在所难免),根据“理论--实证--政策”这一主线对其进行梳理,希望本文能够引起学界和业界对中国统计体系的关注及其改革方向和对策的讨论。

本文余下部分结构安排如下:第二部分研究了统计数据质量理论方面的内容,第三部分研究了统计数据质量评估的经验证据,第四部分研究了改进统计数据质量的对策,第五部分是一个简单的小结。

二、统计数据质量的理论研究

目前国际上针对统计数据质量还没有一个统一的定义,不同的学者也有各自不同的定义。总的来说,从用户、生产者和被调查者三个角度考察,衡量统计数据质量的标准共有11个,即适用性、准确性、及时性、可比性、可衔接性、可取得性、可解释性、客观性(或诚信)、方法专业性(或健全性)、有效性、减轻调查负担。其中适用性、准确性、及时性、可取得性、可比性和可衔接性是国际统计界公认的数据质量之基本

构成要素和各国政府统计机构对数据进行质量检测、监管的重要内容和依据(余芳东,2002;Wang and Strong,1996;Naumann and Rolker,2000)。我们可将上述标准理解为统计数据质量的内涵。绝大部分文献,仍然以准确性评估为核心内容,因此统计数据质量存在问题一般都是指统计数据失准或失真。

(一)统计数据失真机理

统计部门的行为会直接影响数据质量,如统计数据搜集整理过程中出现的设计误差、调查误差、汇总误差等(王强,1990;颜德纶,1990)。统计主体间的博弈是产生数据质量问题的重要诱因,如企业和统计部门、上下级、区域间基于利益的博弈(朱秀君,2000;卢冶飞,2003;朱文兴、张继良,2005);官员业绩博弈、干预基层博弈和干预统计博弈(林勇、杨言勇,2008);地方官员在经济竞争当中的政治晋升博弈(周黎安,2004)。同时,袁平德(2004)指出被统计部门(地方、企业)之间的博弈容易造成各种攀比现象,表现在总量上攀“块头”、均值上攀“高低”、纵比上攀“速度”、横比上攀“位次”、“唯上”中攀“宠幸”。

【统计调查数据质量控制研究】

对于统计体系,现行的国内生产总值(GDP)核算体系本身的缺陷则是文献所关注的重点。世界银行(1992)认为中国以样本为基础的生产指数和独立构造的价格平减指数欠缺,没有对未出售的库存进行冲销,导致了中国官方对GDP总量数据的低估和速度的高估;李成瑞(1997)指出经济成份分类方面的科学性问题和所有制结构统计调查方面的准确性问题导致了含混或不准确和某些虚假不实现象的发生;孟连和王小鲁(2000)总结了七个导致数据偏差的可能机制。许宪春(2002)认为现行的GDP核算体系中,产业部门分类和支出项目分类仍然过粗,经常性的服务业统计调查制度欠缺,缺乏GDP的分季度生产核算和使用核算,价格指数资料存在缺口,未被观测的经济存在统计遗漏,统计系统的独立性不强,某些统计数据容易受到地方干扰;任若恩(2002)认为中国经济增长率被高估的主要原因是长期以来实行的可比价格法,考虑采用国际上通用的价格指数缩减法和生产指数法来测算经济增长率。岳希明(2005)指出劳动统计方法的差异导致了就业人员总数、就业人员行业以及它们的时间变化方面较大的差异。宋小川(2007)通过讨论现行GDP核算体系的缺陷,认为中国GDP及其增长率被严重低估。【统计调查数据质量控制研究】

同时统计管理体制、统计制度方法、统计基础工作、统计外部干扰等是影响政府统计数据质量的重要因【统计调查数据质量控制研究】

素(政府统计数据质量研究课题组,1999)。肖宜滨(1999)在法学范畴内剖析了影响统计数据质量的原因,主要有行政自由裁量权对主体的干扰、部分统计工作者统计法制观念淡薄、请求权的非强制性。

以上文献主要从统计部门、统计体系和统计外部体制环境三个方面分析了中国统计数据失真的原因。事实上,三个方面是相互影响的,尤其是外部体制环境对统计部门的影响这一因素在中国尤为显著。很多时候,统计部门受到地方政府的干扰以及同级部门之间源于考核指标的竞争,而牺牲了统计数据的真实性。尤其是地方政府源于升迁和争取中央政策支持而产生的数据攀比和赶超,不能不引起公众对其所公布的统计数据真实性的怀疑。很多地区同年GDP增长率和该地区历年增长率惊人的相似以及和上级要求指标惊人的一致即为明证。很多文献也反复提及这一因素。理论上,统计体系本身的缺陷对数据质量的影响应该是系统性的,即在影响方向上应该是不变的。因此,导致目前统计数据存在问题的很大一部分原因可以归结为地方政府催生的统计部门间的博弈。

基于对以上三个方面因素作用机理的理解,国内外学者主要从统计数据质量控制、统计数据质量评估、统计数据质量管理三个方面出发,进行了大量的理论研究,给出了控制、评估和管理方法。

(二)统计数据质量控制【统计调查数据质量控制研究】

统计数据质量的控制,主要是数据搜集和整理过程中对误差的控制,针对统计误差所开展的理论研究,涉及测量误差的统计分布和检验、抽样误差以及非抽样误差、缺失数据的统计处理方法、汇总数据的误差等。基于这些研究,产生了抽样调查方法和非抽样误差控制技术(金勇进、陶然,2010)。Neyman(1934)关于分层抽样最优分配及回归、比率估计的研究是统计数据质量研究的一个重要里程碑。Hansen等(1961)提出了调查误差模型,该模型把总误差(均方误差)分解为测量误差、抽样误差、测量误差与抽样离差的协方差以及偏差的平方四个组成部分,这一模型的建立为调查过程中误差的控制奠定了重要基础,随后的样本重复计量、交叉子样本等方法都是在此基础上发展而来。同一时期,Warner(1965)则对敏感性问题展开专项研究.提出了对敏感性问题调查的随机化方法。Dalenius(1983)认为数据质量的综合控制应包括调查设计控制和调查实施控制两部分,后者又分为预防控制和过程控制。Housman(2003)则将CPI偏差归结为四类:

【统计调查数据质量控制研究】

替代性偏差(substitutionbias)、新产品偏差(newgoodsbias)、质量改进偏差(qualitychangebias)、购买途径偏差(qutletbias)。Costa(2001)和Hamilton(2001)利用恩格尔曲线从总偏差的角度对CPI偏差进行了估计,依据恩格尔定理,他们认为家庭消费支出偏差可能源自对价格的错误估计。这一方法克服了传统方法只能估计单因素偏差的缺陷,同时数据要求较少,可操作性强。

李成瑞(1984)从应用层面,将分阶段实施控制技术分别应用于我国第三次、第四次人口普查,取得了良好效果。傅德印(2000)系统讨论了政府统计数据控制技术,涉及调查变量和调查项目、调查误差类型以及建立和实施政府统计数据质量文档及监测等方面。杨清(2000)分析了系统性误差的特点和分解、产生原因和处理方法以及测定方法。同时,杨清和吴伟霞(2000)指出运用方差分析、多重比较的q检验法(或HSD检验法)和交叉样本技术对原始资料的偏误进行监控。方差分析和多重比较检验二者相互补充,前者分析了控制变量是否对观测变量产生显著影响,后者则进一步确定控制变量的不同水平对观测变量的影响程度。在进行了交叉样本分析之后,进一步运用方差分析和多重比较,则可减弱或消除系统性误差的影响。

(三)统计数据质量评估

统计数据质量评估一方面可以检验所搜集到的数据本身的质量,另一方面还可以检验数据搜集过程中质量是否得到有效控制。

刘孝新等(1997)运用事后预测和反常结果判断法对统计数据质量进行了评估和推断。成邦文和董丽娅(2002)从一致性误差和非一致性误差两个方面分析了社会经济统计数据误差,关于前者的分析内容有趋势性分析、机构对比分析和相关指标关联分析,而对后者的分析则包括分布形态一致性检验和异常数据的识别。刘洪和黄燕(2007,2009)先后运用趋势模拟评估法和相关指标分析法,对统计数据质量进行了定量评估。张德然(2003)给出了根据各数据点的跳跃度所提供的信息来检验异常值的方法。而Rawski(2001)则认为由于现行的各类评估方法在逻辑思路和技术层面都有一定的局限性,因此在讨论中国统计数据质量时,应该更多关注整体经济数据的精确度、范围、覆盖面、统计方法以及其他技术问题。

管于华和尚卫平(2003)根据CDDS国际标准对中国国民核算账户进行评估,从实际部门、财政部门、

统计调查数据质量控制研究(四)
完善我国统计数据质量控制的研究

  【摘 要】统计数据的质量既要从专业技术层面进行评估,更要从统计流程的各个环节加强控制。为此,国内一些学者开始借鉴质量管理学理论及国际质量管理标准,对我国统计数据质量控制体系的构建展开了积极的探索,这也是未来统计体制改革的方向之一。

  【关键词】统计;流程;质量控制;体系
  统计数据质量控制要贯穿于统计工作的全过程,统计数据的质量是统计过程化控制的结果,因而影响数据质量的因素存在于各个阶段。当前对我国统计数据质量问题展开了深入的研究和探讨,同时统计部门也从统计方法改进等多个环节开展了以提高数据质量为中心的统计改革,取得了一定成效,但是当前提高我国统计数据质量依然任重道远,本文系统地提出各阶段的质量控制标准与数据质量控制技术,以确保统计数据的可靠性。
  一、统计数据质量控制标准
  一般来说,要保证和提高统计数据的质量,就必须在开始阶段严格控制能影响统计数据质量的各个因素,同时,在实施统计工作的过程中对各个阶段实施质量控制,数据严格把关,最终才能形成涵盖整个统计流程的质量控制体系。当前由于质量控制标准不能完全在统计各阶段实行,因此需要构建适用于各个流程的质量控制标准,以更好地指导统计工作。(1)从统计设计阶段来看,这一阶段的主要设计内容包括:统计指标及指标体系设计;报表设计;统计方案设计;统计方法设计;统计工作组织与协调设计等。这是统计工作的第一步,也是统计质量控制的首要环节,这一阶段质量的好坏直接影响到后面三个阶段质量控制的效果,因此,在数据质量控制标准制定时,应充分考虑合理性和可行性。(2)从统计调查阶段来看,这是统计工作的主体部分,这一阶段数据质量控制标准为:调查数据的可靠性;调查项目与调查范围的合理性;统计数据搜集的人员配备情况及搜集数据人员的职责明确、分工合理;数据搜集工作严格按照统计调查方案组织实施;调查数据填报的及时性;调查成本的经济性;被调查者信息的保密性等。(3)从数据整理阶段来看,这一阶段质量监控就是保证数据真实有效,在加工整理过程中坚持实事求是的原则,不能出现数据遗漏,根不能人为修改数据以满足自身利益需要的情况。(4)从数据发布阶段来看,这是统计工作的结尾,为了规范统计数据发布方式,避免统计数据失真以及无序发布、使用统计数据资料造成的不良影响,应加强对统计发布阶段的数据质量控制。
  二、统计数据质量控制体系
  (1)统计设计阶段的质量控制。统计设计阶段的质量控制必须适应宏观决策要求,加强统计指标及其指标体系的设计,及时调整统计调查计划与实施方案。其质量控制措施主要包括:一是在设计统计指标、指标体系及其计算方法的过程中要坚持合理性的原则。要根据统计目标出发,明确统计对象的特点和范围后,确立统计指标,建立完善的统计指标体系。制定的指标要符合统计制度的规定,范围要全面,分组要准确,编码规则要科学,指标涵义的解释和计算方法要精确。二是设计完善的统计调查制度。完善的制度是各项事业能够顺利进行的根本保障,统计工作更是如此,在具体统计工作开始之前,要明确统计人员的工作职责,按照规范流程统一工作,完善编辑规则。如果涉及到抽样调查还要准备估计方差的计算方法。三是重视基层统计设计工作,服务于地方政府经济管理需要。四是强化统计信息化建设,充分发挥计算机和网络的功能,保证统计设计实效性,提高工作效率。(2)统计调查阶段的质量控制。一是提高统计人员业务素质。加大调查员的技能培训力度,提高调查员的调查素质,包括调查技巧、随机性原则的把握等,从而使调查员能够准确系统地理解掌握调查方案、调查内容、统计指标的口径范围、计算方法和时期时点等,能够用被调查者容易理解并正确回答、填报的逻辑去进行调查工作。二是在调查过程中,针对统计设计阶段的调查方案、指标体系、问卷等存在的问题及时提出改进意见。一旦发现统计指标口径不一致或不完整的资料,及时向上反馈,征得同意后,进行调整、补充。加强事后对采集得到数据或基层上报资料进行质量审核和重点抽查。这是统计调查阶段不可或缺的一项工作,其原因在于降低统计调查风险,防止通过调查所取得的数据与调查设计的预期存在较大偏差。(3)数据整理阶段的质量控制。一是重视数据录入阶段的审核工作,在数据录入工作中应避免由数据采集者直接录入的方式,同时,为减少数据出现差错几率,可以采取边录边审以及时发现问题。数据录入的质量控制可按照事先设计好的程序代码加以控制,如指标的逻辑关系控制、二次录入复核以及交叉复录比较等方式。对采取网上直报系统的,要加强审核公式的设置。二是对敏感指标的数据填报要进行重点检查,如使用历史数据进行趋势比较,观察其波动幅度,识别调控异常值。一旦发现数据有异常或者与实际情况不符,应进行核实,避免错误数据进入汇总处理阶段。三是加强对汇总数据的质量控制。制订全面的汇总计划、汇总方法、审核方法,明确主要指标汇总、分析性汇总、整理性汇总的计划和分工。在数据上报过程还应加强对数据文件的内容、文件名及其命名规则的一致性检查,以消除编辑误差。四是加强对汇总数据的大数审核。各级统计部门可灵活运用探索性数据分析法、动态趋势法、比例趋势评估法、结构对比评估法、指标变动趋势经验对比法等多种方法对汇总数据进行全方位、多角度分析,通过核查数据总量指标、相对指标、结构指标、平均指标等是否与本地经济社会发展实际情况相符,确保统计数据的准确性。(4)数据发布阶段的质量控制。这一环节的重点就是加强数据质量评估和检查,防止有问题的数据流入市场。这一环节的质量控制措施主要有:一是在统计数据发布之前,应由专人对数据质量从头至尾进行一次全面的审计稽核,确保发布数据的可靠性。特别是对关系人民群众切身利益的敏感数据在发布时应尽可能做到如实说明统计数据的来源、调查方法,提供统计数据的文字说明和统计数据的交叉检验,坚持尊重客观实际,真实地反映当前经济运行情况。在此基础上,出具数据质量评估报告,并和统计数据同时公布,接受社会监督。二是重视抽样调查数据和非全面调查数据的发布方式,不能轻易地将其等同于全面调查予以发布,以免以偏盖全。特别是对一些代表平均水平的统计数据要注意其容易掩盖的差异。三是借鉴国际统计数据发布标准的基础上,加快构建一套适合我国政府统计特点的统计数据发布标准化体系,在发布统计数据过程中,要根据不同性质的统计资料,使用不同的导语,并且尽可能做到结论清楚、语言易被读者接受,尽可能使用一些大家都熟悉的术语。切实避免不同部门发布的同一类型的统计数据间相互矛盾、冲突等。同时,建立健全公众统计数据使用效果的反馈机制,充分吸纳和考虑用户的意见,并及时反馈到统计设计阶段,以进一步加强统计设计质量。(5)统计数据质量成本控制。统计数据质量成本应当包括发生在整个统计数据生产工作中的统计数据质量保证成本和质量控制成本,以及发生在统计数据生产过程中和统计数据信息发布后的内部及外部质量损失成本。首先,要充分根据一定的统计调查工作规模,预测统计质量成本,特别是投入成本给出一个能够承受的最高上限值。此时就必须以质量成本的控制为优先考虑,也即需要在质量投入成本一定的情况下来对比不同抽样设计时的效率,选择质量投入成本一定时质量水平最大的设计方案,然后根据在统计工作的每一个环节均可搜集相关的成本信息和质量信息来建立模型。当质量总成本曲线最底点所对应的质量水平没有达到事先设计的质量水平时,此事就应该增加质量投入工作来提升数据质量水平;当现有的质量工作使得统计数据质量水平超过质量总成本曲线的最低点所对应的质量水平,说明现有的质量工作过度,为了减少总质量成本,在保证达到预定统计数据质量水平前提下,可以适当的减少质量工作,从而降低工作成本。
  参考文献
  [1]杨帆.《统计调查过程中对数据质量控制的研究》.新财经·上半月.
  2011(11)
  [2]王艳红.《统计工作中如何提高统计数据质量有关问题浅谈》.城市建设理论研究.2012(9)

本文来源:http://www.zhuodaoren.com/shenghuo318773/

推荐访问:统计数据质量问题研究 如何控制统计数据质量
扩展阅读文章
热门阅读文章