中国经济增长数据检验：问题、研究与结论

时间：2026-01-27 理论教育小谭同学版权反馈

【摘要】：第七章结论与展望第一节问题的提出、研究过程与结论概述经济增长统计数据是显示经济运行状况和经济增长周期状态的主要风向标，是国家宏观决策和政策制定的重要依据。中国经济一直保持持续增长的态势。作为全面研究中国各省经济增长统计数据可信度检验的一个预研究和应急性研究，主要目的是在提供全面检验中国各省经济增长统计数据可信度的理论模型与经验分析框架方面进行一些尝试。

第七章　结论与展望

第一节　问题的提出、研究过程与结论概述

经济增长统计数据是显示经济运行状况和经济增长周期状态的主要风向标，是国家宏观决策和政策制定的重要依据。统计部门提供的数据显示，改革开放以来，中国经济发展的实绩令世人惊叹。GDP的年均增长率在20世纪80年代为9.8%，90年代为9.7%，在1979～2001年间为9.5%。中国GDP在2003年增长9.1%的基础上，2004年仍达到9.5%。中国经济一直保持持续增长的态势。2003年中国GDP总量首次超过11万亿元达到11.67万亿元。按现行汇率计算，2003年中国GDP总量相当于1.4万多亿美元，人均达到1090美元。根据国际经验，人均GDP达到1000美元，预示着中国经济将进入新一轮的增长周期。

然而，长期以来，人们对中国经济增长统计数据的可信度或真实性一直存在争论。众多国内文献指出，目前出现的统计问题大多与政绩有关，越是领导关心的统计数字就越可能不准（统计数字质量研究课题组，1995；赵宝珍，1997）。据统计部门内部及其他知情人士透露，“报喜得喜、报忧得忧”、“数字出官、官出数字”的观念十分流行（于洪彦等，1990；赵鹏，1998）。目前社会经济生活中弄虚作假、篡改统计数字的问题相当严重，统计违法现象普遍存在，而且，越是到基层，数据失真越严重。“从2000～2003年，各省区市核算的GDP增长速度的平均数，比国家统计局核算的全国数据分别高出1.7、2.0、2.6和2.8个百分点，差距呈逐年扩大趋势”。“而省内各地市的总和又高于省级核算2个百分点左右，各县级总和又高于市级核算1～2个百分点”。（李德水，2004）。乡及乡以下统计违法现象特别严重，产值以虚报为主，人口与劳动工资以瞒报为主（乐大华，1998）。乡镇工业总产值多以现价代替不变价，且存在严重浮夸（杨本全，1989；刁恒昌等，1996）。几乎与此同时，大量的国内外学者，也认为中国经济增长统计数据存在不真实的问题。对中国GDP增长速度提出质疑的西方学者之中，素有“国际经济乌鸦”之称的克鲁格曼（Krugman）教授和匹茨堡大学的罗斯基（Thomas G. Rawski）教授，表现得最为激进。克鲁格曼毫无根据地声称，看中国经济增长数据，就像看一部科幻小说，中国的经济统计数据，是一堆不可置信的符号体系。罗斯基连撰数文，根据中国GDP与能源消费、就业等相关数据间的不协调性，认为中国GDP数据不可信（Rawski，1993；2001a，2001b）。世界银行的研究报告（1997）认为，1978～1995年间，中国年均经济增长率应从官方的9.9%修正到8.2%；Augus Maddison（1998）认为，中国这一时期的年均增长率应为7.5%。Young认为，1978～1998年中国经济的年均增长率应调整到6.1%。

为了从理论和实践的角度，对国内外关于中国经济增长统计数据失真的观点进行系统地检验研究，本项目确定了以探索中国经济增长统计数据的内在矛盾、构建检验中国经济增长统计数据可信度检验的理论模型与经验分析框架为主要研究目的，以中国的省级单位为基本研究单位，以省级单位的经济总产出（总增加值或地区生产总值）及其增长率与各种宏观经济变量之间的关系为研究对象，确定不同省份最大可能的经济增长率，并据此估算中国经济实际增长与统计数据之间的差异程度。

本项目最初由全国人大常委会副委员长蒋正华教授提出。作为全面研究中国各省经济增长统计数据可信度检验的一个预研究和应急性研究，主要目的是在提供全面检验中国各省经济增长统计数据可信度的理论模型与经验分析框架方面进行一些尝试。因此，从性质上说，这是一个探索性的、应急性的研究。

本项目于2005年9月22日在国家自然科学基金委（主任基金）正式立项，2006年2月底结项，历时5个月。在蒋正华副委员长和自然科学基金委相关领导与工作人员的大力支持下，本项目不仅按照研究计划的目的和要点按时完成，而且探索到了显示省级单位经济增长统计数据内在矛盾的方法，构建了探索经济增长与能源消费、交通运输、社会商品零售总额、电信业务量、消费者价格指数、全要素生产率之间关系的理论模型，并利用典型省份的数据进行了实证检验。本项目非常完满地完成了研究计划要点指定的相关内容，达到了探索性研究和预研究的目的。

为了探索中国省级单位经济增长统计数据的真实性或可信性，在蒋正华副委员长的亲自率领下，研究小组成员特意到典型省份进行了实地考察和调研，与该省统计局的核算部门、农村调查队、城市调查队等单位的领导和工作人员，进行了非常细致的座谈，详细了解了有关住户调查、抽样调查、普查等具体实施情况，并获得了相关的第一手资料。同时，我们还与北京市统计局核算部门的领导与工作人员进行了细致的座谈，并请北京市统计局新闻发言人给课题组成员及相关研究人员和研究生，具体介绍了北京市地区生产总值统计与核算方法、存在的问题以及相关的改革过程和措施，对地区生产总值及其增长率的核算与国家统计部门的核算之间的差异进行了说明和解释。

本项目系统地展示和分析了中国经济总量及其增长速度不同核算方式之间存在的差异及其原因；全面阐述了国内生产总值（或地区生产总值）及其增长速度的理论性质与经验性质，并据此说明了不同核算方式的核算结果之间存在一定程度差异的必然性；总结和归纳了有关中国经济总量与经济增长速度研究的大量文献所运用的方法，对比了不同研究方法所获得的有关中国经济总量与增长速度的估计结果，分析了各种方法存在的问题；运用协整技术和误差修正技术构建了经济增长与能源消费之间的关系、三次产业增加值与能源消费之间的关系模型，并对经济增长率与三次产业增加值增长率进行了模拟与分析；运用向量自回归（VAR）协整与因果关系检验技术，构建了非GDP核算变量（主要包括电信业务类变量、交通运输类变量、储蓄存款类变量、社会商品零售额、居民消费价格指数这五大类变量）与经济总量及三次产业增加值之间关系模型，并对经济增长率与三次产业增加值增长率进行了模拟与分析；系统研究和比较了全要素生产率核算的经济增长核算方法、计量经济方法和数据包络分析方法的优缺点，并运用数据包络分析方法对典型省数据进行了实证分析；根据经济总量的不变价格指数与三次产业的不变价格指数，运用不同方法探索了三次产业增加值与总增加值之间的矛盾，并运用相关模型重新估算了典型省的经济增长率与三次产业增加值的增长率。

本书是国内第一次系统地研究检验中国地方经济总量及其增长速度数据可信性理论、模型与方法的一个尝试，并第一次进行了实证研究。本书所运用的方法与模型，都是计量经济学中最为前沿的，因此，从理论和方法的角度说，本书的研究具有前沿性。从实证检验结果来看，本书构建的检验中国各省经济总量及其增长速度的模型和方法，能够比较有效地诊断典型省份相关数据的可信性。这些模型与方法可以应用于其他省经济增长数据可信性的检验研究。因此，本书对于全面检验中国各省地区生产总值及其增长速度的可信性，核算中国经济增长率与经济总量的实际水平，为国家制定相关公共政策提供准确、可靠的数据，具有重要的理论意义和现实意义。

本书是一个集体讨论的结果。在蒋正华副委员长的大力支持和亲自领导下，课题组所有人员共同讨论，确定思路、理论与方法，最终由杨冠琼执笔完成。

第二节　中国经济总量及其增长速度不同计算方式之间的差异及其原因

从大的方面来说，一国经济总量及其增长速度的估计主要从两个方面进行：一是以可比货币为计算单位在国际层面上的不同国家之间进行比较；二是以本国货币为计算单位在本国内部进行不同方面的比较。

一、国际比较项目核算中的差异及其原因

以可比货币为计算单位在国际层面上对不同国家经济总量及其增长速度进行比较，主要有两种方式：一是按本国货币与美元之间的兑换比率（即汇率），将以本国货币计算的国内生产总值折算为以美元计算的国内生产总值；另一种是按购买力评价方式来计算。

长期以来，中国采取钉住美元的有管理的浮动汇率制度，所以，美元和人民币的比价近年来变化不大。世界银行公布的按汇率计算的中国的GDP，就是按其现行官方汇率在中国官方数据的基础上折算得到的，基本上与国家统计局公布的GDP一致。按这种方法计算，中国GDP在2000年突破1万亿美元，2004年约为1.4万亿美元，不到日本的1/3。世界银行的资料表明，2000～2004年，中国GDP总量一直排在美、日、德、法和英之后，居世界第6位，约占全球总产出的4.4%。这种按汇率折算的方法，面临两个方面的问题：一是以本国货币核算的国内生产总值是否真实；二是用来进行折算的汇率是否反映了两国货币之间真正的比例关系。由于不同学者和研究机构在其中之一或这两个方面持有不同意见，因此，按汇率折算的中国GDP在不同的研究文献中也显示出不同的结果。

二、中国经济总量及其增长速度的国内政治机制引致的差异

改革开放以来，中国各地方的地区生产总值竞赛始于20世纪80年代中期，这其中最重要的原因，就是传统计划经济时期政府绩效考核方式的继续影响。不过，这种绩效考核的具体形式在不同时期有不同的具体体现。20世纪80年代中期后的具体形式是社会组织形式的重构或升级，由于这种重构或升级被视为地方政府的政绩，下级政府为了向上级政府显示这种政绩，中国各地生产总值及其增长率也就自此开始有了水分。进入20世纪90年代以来，虽然城镇化和城市规模扩大浪潮已过，但以GDP为核心的政府绩效考核方式本身成为一个自立的指标。结果是，有关各地方政府在统计数据上弄虚作假的报道开始接连不断地出现。在相互影响下，这种有水分的生产总值及其增长率变得日益普遍并日趋严重。

官方对这种有水分的生产总值及其增长率的最初的反应，是1993年统计部门进行了一次全国范围的工业总产出和增加值统计大检查，并引发了中国改革开放以来国家统计部门第一次对原有统计数据的修正。

最初的这一反应引发了国家建立统计执法检查活动，每年进行一次全国统计大检查，结果是发现的问题越来越多。因此，国家对统计方式与核算方式进行了较大的改革，由原来的“逐级核算”改变为“逐级核算”与“超级汇总”相结合的核算方法，并且在核实“逐级核算”方面进行了一系列努力，例如扩大抽样调查范围等。

2004年国家统计局又对中国各省总增加值的核算制度进行了一次重大改革，将各省国内生产总值改为地区生产总值，并取消了各省发布地区生产总值的权利，各省地区生产总值不再由本省核算，而是由国家组织相关人员进行统一核算。

三、中国经济总量及其增长速度的地方加总差异

从理论上说，一个国家的GDP与其所属各地区的增加值总和应该是完全相同的。然而，在中国，国家核算的GDP与各地方核算的增加值之和，以1995年为分界点，呈现出两种完全不同的样式。自1985年中国实施SNA起，直到1995年，国家核算的GDP始终大于地方核算的增加值之和，而且两者之间的差额在不断地缩小。但自1996年起，各地方核算的增加值之和开始大于国家核算的GDP，而且两者之间的绝对误差和相对误差都呈现出不断扩大的趋势。2000～2003年这一差额分别达到7763.58亿元、10830.87亿元、15216.34亿元和18250亿元。这些差额分别相当于当年北京市地区生产总值的3.13倍、3.81倍、4.74倍和4.98倍，如此庞大的误差，不可能是由于非系统因素造成的（见表7-1）。

表7-1　1985～2003年地方公布GDP之和与中央公布GDP的差异

总量加总上的差异若显示了在中国各省之间的确存在“GDP情结”的话，那么，由于中国各地区之间在经济发展的初始条件、自然资源禀赋、空间地理位置分布等都存在重大差异，绝对量的可比性相对要差一些，纵向可比性可能更要强一些，各地追求速度可能比追求数量的动机要更强一些。因此，从理论上说，各地生产总值增长速度与国家核算的GDP增长速度也应该存在显著差异。为了显示这种差异的存在，我们计算了各地区生产总值增长速度与国家统计部门核算的GDP增长速度。在计算各地生产总值增长速度时，主要采用了两种方法：一种方法是简单的算术平均；另一种方法是加权平均。计算结果表明，2003年各地生产总值增长速度的算术平均值为11.21%，高出全国增长速度2.01个百分点，加权平均值为11.98%，高出全国增长速度2.88个百分点，即2003年各地生产总值增长速度比全国增长速度高出31.7%（见表7-2）。

表7-2　1992～2003年地方公布GDP增速与中央公布GDP增速的比较

续表

资料来源：1992～1995年GDP数据，来自《中国统计年鉴1996》；1996～2001年GDP数据，来自《中国统计年鉴2002》；2002～2003年GDP数据，来自国家统计局和各省、市、自治区统计局发布的《国民经济和社会发展统计公报》。统计中用到的1991年数据，来自《新中国五十年统计资料汇编》（国家统计局国民经济综合统计司编，中国统计出版社1999年11月版）。

四、中国经济总量及其增长速度评估的意义

系统评估与研究中国经济总量及其增长速度具有重大的理论意义和实践意义。首先，是把握和监视中国经济运行状况、进行适时、正确的宏观调控的基础；其次，是正确理解经济增长方式与各种经济变量之间关系的基础；最后，是恰当地享受相关优惠待遇、承担国际义务以及发挥相应政治作用的基础。

第三节　中国经济增长统计数据可信度的检验方法

一、GDP的理论性质与经验性质

GDP以市场价格为基础，没有市场价格，就不可能计算出某种经济活动的净产出。而某种经济活动的市场价格又是以该经济活动存在市场交易为前提的，没有市场交易，就没有市场价格，因而也就不存在作为GDP构成的净产出。GDP以市场价格为基础的这一性质，决定了任何国家在任何时期的GDP都不存在一个绝对精确的数字。因为任何国家的经济行为人都存在非市场交易（如家庭活动），任何国家都存在非市场定价的经济活动。任何国家都存在地下经济活动，没有一个国家能够准确地将地下经济活动所形成的产出价值，因而也就没有一个国家能够获得精确的GDP数字。

如同任何理论转换为经验一样，GDP概念在这种转换过程中，由于存在各种各样的信息约束，必然存在理论概念与经验概念之间的差异。这种差异主要体现在如下GDP的经验性质上：GDP的三种测量方法所获得的GDP数字，在任何国家都存在差异，有时是存在相当大的差异；名义GDP与实际GDP在转换过程中必然存在差异，而且这种差异的大小，与技术进步的速度，特别是与新产品出现的速度、与产品质量提高的速度以及与产品成本降低的速度成正比例地关系；以本国货币与外国货币测量的GDP，以及以PPP方法测量的GDP，必然存在差异，而且往往无法将导致这种差异的主观因素和客观因素区分开来；经济是特定文化的产物，不同的文化蕴育着不同的市场经济。各个不同国家都存在不同的非市场交易或非市场定价的特定经济活动。

上述GDP的理论性质和经验性质表明，GDP的估计是一种对经济总体状况的近似估计，没有任何一个国家能够精确地计算出其GDP数字。对于任何一个特定国家来说，利用不同方法测量GDP所获得的数据存在差异，并不值得大惊小怪。最为重要的是，如果没有进一步的信息支持，人们根本无法判断用哪种方法测量的GDP更为准确。

二、中国经济总量及其增长速度研究的主题变迁

国内外学术界以及相关机构关于中国GDP的研究大致可以分为三个时期：一是第二次世界大战后到20世纪60年代中期；二是20世纪80～90年代；三是90年代到现在（2005年）。

关于中国GDP的早期研究，学者们主要是围绕国民账户体系的建立为中心而展开的。由于第二次世界大战以后西方国家陆续实施了国民账户体系，为了对经济的整体活动水平加以测量和进行国际比较，构建中国的GDP序列就成为经济学研究的一项基础性工作。这一时期代表性人物主要有巫宝三（OU，1947）、刘大中和叶孔嘉（Liu和Yeh，1965）、赵康（1965）等人。这一期间，西方国家的学者们各自出于不同的目的，在不同时期研究了中国的GDP水平。但西方学者的大部分研究均以前面的研究为基础，因而不论在方法上，还是在结果上，都没有使这种研究向前推进或改善。“冷战”时期，出于政治目的，美国中央情报局（CIA）曾经做过一些研究，试图独立地和重新地构建中国GDP序列和中国工业增长率，以便了解中国的经济实力和军事实力，其研究结果分别发表于美国国会联合经济委员会1972年、1975年、1978年和1982年的年度报告上。由于当时无法获得相关数据，因此这项研究所采用的估计方法非常粗糙，结果并不令人满意，于是该项目于1982年终止。

第二个时期的研究主要围绕中国国民生产总值账户的建立以及由物质产品体系（MPS）向SNA转换问题。随着中国改革开放和融入世界经济程度的提高，中国有必要使用国际通用术语——国民生产总值——来向世界说明和展示中国经济的规模与增长速度。为此，中国开始了建立国民账户体系的艰苦探索。这一时期的工作主要由国家统计局完成。统计部门于1985年建立了国家和省两级国内生产总值核算制度，并于1987年编制了第一张SNA类型的投入产出表，即《1987年度中国投入产出表》，在此基础上，于1988年首次公布了回推到1978年的中国GDP估计值。此后，中国不断完善其国民经济核算体系。1989年开始试行支出法国内生产总值核算。1993年，中国正式取消国民收入核算，启用支出法国内生产总值核算体系，国内生产总值从此成为中国国民经济核算的核心指标。

第三个时期关于中国GDP的争论，中外学者及相关机构主要围绕着三个主题进行：一是中国官方GDP低估了中国实际GDP；二是中国官方的GDP增长率过高估计了中国经济的增长率；三是按PPP估算的中国实际GDP及其增长率的合理区间问题。此时的代表人物和机构主要有伍晓鹰（1993，2000，2002）、任若恩（1997）、亚当斯—陈（1996）、Maddison（1998）、Keidel （1992）、World Bank（1992b and 1994b）、Shiau（2005）等。

三、中国经济总量及其增长速度的检验方法

自从中国官方公布了历史GDP及其增长率数据之后，人们提出了各种方法来检验这些数据的可信度。归纳地说，这些方法主要包括物量指数法、价格指数法、PPP方法、能源消费、货物运输量等经济变量与GDP相关分析法、全要素生产率（TFP）法、加工深度系数法等。各种方法的估算结果如表7-3和表7-4所示。

表7-3　中国全部GDP、工业GDP增长指数和年增长率的官方和替代估计值

注：估计数据分别取自麦迪森（Maddison，1998，Table C-5）、任（Ren，1997，Table 5.3）、伍（Wu，2000a，Table 4）、亚当斯—陈（Adams和Chen，1996，Table 4）和国家统计局（SSB，1998）。
*麦迪森的“物量变动法”以部门为基础，旨在消除由官方缩减指数反映不充分的某个特定部门中实际价格变动的影响，该方法的合理性主要建立在理论和经验知识的基础上。
**同任若恩的研究中（1997）所使用的工业生产者价格指数类似。

表7-4　胡永泰和麦迪森对增长率高估的校正，以及胡永泰对中国TFP表现的分解

注：胡永泰（Woo，1996）；麦迪森（Maddison，1998）。(https://www.xing528.com)

表7-3和表7-4中的数据表明，不同方法估算的结果存在一定的差异。在没有获得进一步证据的情况下，无法做出哪一种方法是更为有效的判断。从理论上说，每一种方法都各有其优点，也存在不可忽略的严重问题。任何一种方法对中国经济总量及其增长率所做的估计的可信性，都需要有进一步的证据来证实。

第四节　经济增长与能源消费：基于协整与误差修正模型的研究

协整分析被认为可能是20世纪80年代以来计量经济学中最具革命性意义的发展。简单地说，协整就是具有向上或向下趋势的非平稳时间序列随着时间的流逝而共同“漂移”（drift together），犹如人与其影子共同移动一样。不同变量的这一共同漂移使得变量间可能存在长期线性关系，因而可以预期经济变量之间存在均衡关系。但是，如果变量间不存在这种长期关系，那么，这些变量之间就是“非协整”（not cointegrated）的。

一般而言，协整分析是估计非平稳时间序列间长期或均衡关系的一种方法，也是设定、估计和检验动态模型的一种新技术，因而可用以检验经济理论或经验命题的有效性。此外，协整分析还可用于研究变量间短期或非均衡关系，因为可以利用协整方法所获得的长期参数来探索短期或非均衡关系，即所谓的“误差修正模型”。

为了探索典型省份经济增长与能源消费之间的关系，本书利用计量工具考察了典型省份GDP与能源消费的关系，并通过构建结构模型和自回归移动平均模型模拟了GDP增长率，并构建了GDP及其增长率的95%置信区间。本书选用的代表产出性的变量有典型省份GDP、第一产业、第二产业与第三产业以及工业增加值，代表能源消费的变量有能源总量，不含电力的能源消费量以及电力，并对每一种产出与每一种能源消费量之间的关系，进行了详细的考察。实证研究结果表明：

（1）典型省份能源消费总量与典型省份GDP、农业增加值、第三产业增加值、工业增加值是协整的，即存在长期均衡关系，与第二产业增加值不是协整的；不包含电力的能源消费总量与GDP、农业增加值、第二产业和第三产业增加值以及工业增加值是协整的；电力消费与所有产出变量都不是协整的。

（2）典型省份大部分产出变量与大部分能源消费变量之间存在单向的因果关系，即经济增长为能源消费的Granger原因。能源消费与经济增长之间关系的短期波动，主要是由于工业或第二产业产出水平与能源消费之间关系的波动引起的。

（3）第二产业产出水平对能源消费的影响随着产出水平的提高而增加，但这种增加是规模递减性的，第二产业产出水平的能源消费弹性具有先上升后下降的趋势，因而能源消费与第二产业产出水平的关系是一个非线性关系，进而表明能源消费与GDP的关系也是一个非线性关系。因此，从能源消费的线性变化中不能推出GDP的确切变化，因为能源消费不仅与GDP总量相关，而且与GDP的结构，即经济结构相关。

（4）包括能源变量非线性项和结构变量的模型能够较好地模拟和预测典型省份GDP及其增长率。

（5）典型省份GDP序列具有较强的鲁棒性或一致性，因而自回归移动平均模型能够较好地模拟和预测GDP及其增长率。1993年以后，两种模型模拟的GDP增长率相对于GDP统计增长率，具有更强烈的波动性（见图7-1）。

图7-1　GDP统计增长率、ARMA模拟增长率与基于能源与结构变量模型的模拟增长率（%）

（6）两种模型给出的模拟GDP与统计GDP之间的相对误差大多数是可接受的，但两种模型给出的GDP模拟增长率与统计增长率之间的绝对误差，在某些年份超出了可接受的范围。两种模型给出的GDP及其增长率的95%置信区间都在可接受的范围之内。两种模型模拟的GDP及其增长率之间的相似性，超过了与统计GDP及其增长率的相似性。

（7）仅从两种模型显示的经济模拟增长率来看，典型省份GDP统计增长率有高估的年份，也有低估的年份，综合影响基本相互抵消。因此，从长期来看，典型省份GDP统计增长率平均数是可信的，但这只是一个暂时的结论，需要有更进一步的证据加以检验和支持，特别是需要与中国的总体状况及其他省份的状况加以对比后，才能确认这一结论的可信性。

第五节　非GDP核算数据与GDP间协整与因果关系的检验与分析

为了从非GDP核算数据探索典型省份经济增长数据的可信度，我们利用向量自回归模型构建了非GDP核算数据与产出数据之间的关系模型，一般采用Johansen（1988）、Stock和Watson （1998）提出的多变量协整方法，检验各变量间的协整关系与因果关系。本书选用的代表产出性的变量有典型省份GDP、第一产业、第二产业与第三产业以及工业增加值，代表非GDP核算数据的变量有旅客运输量、货物运输量、旅客周转量、货物周转量、城乡拥有电话户数、电信业务总额、城乡居民储蓄存款余额、社会商品零售额、居民消费价格指数。这些非GDP核算变量可分为五大类：一是代表电信业务类的变量；二是交通运输类变量；三是储蓄存款类变量；四是社会商品零售额；五是居民消费价格指数。并以这些非GDP核算变量为解释变量，构建了计量经济学模型。实证研究结果表明：

（1）典型省份GDP、第一产业、第二产业以及第三产业增加值，与电信业务类变量、交通运输类变量、储蓄存款类变量、社会商品零售额、居民消费价格指数等非GDP核算变量之间是协整的，而且存在多个协整关系；同时，三次产业之间存在协整关系。三次产业间这种协整关系表明，经济发展是一个平衡推进的过程，各产业间存在彼此相互作用的关系，抑制某个产业的发展将严重影响其他产业的发展，进而会影响经济的整体发展。其中，第三产业对其他两个产业的产出弹性最大，这一事实表明，营造第三产业发展的良好环境，促进第三产业的发展，对于促进经济的整体发展具有事半功倍的效果。

（2）典型省份GDP、第一产业、第二产业以及第三产业增加值，与电信业务类变量、交通运输类变量、社会商品零售额、居民消费价格指数等非GDP核算变量之间存在单向或双向Granger因果关系，而与储蓄存款类变量不存在因果关系。特别是交通与通信类变量，与GDP、第一产业、第二产业以及第三产业增加值之间存在显著的双向因果关系。这表明了交通与通信在经济发展中的基础性作用。

（3）以非GDP核算变量为解释变量的模型，比较好地模拟了GDP数据。该模型解释了GDP变差的99.9%，各变量均在1%显著性水平上显著，残差序列不存在序列相关。该模型模拟误差的均方根为rms error = 0.021397，绝对值误差均值为0.016880，绝对值百分比误差均值为0.23626，Theil不等系数（U）为0.001409，偏差比率（UM）为0.000000，方差比率（US）为0.000144，协方差比率（UC）为0.999856。由于方差比率相对较小，协方差比率相对较大，因此，该模型具有较为优良的模拟与预测GDP的能力。依该模型模拟的GDP计算的GDP增长率的年平均值为12.04 （1979～2004年），与相应期间的统计增长率的年平均值11.92，只相差0.12个百分点。这表明，以非GDP变量作为解释变量的GDP模型，显现不出GDP自身的真实性问题。

（4）以非GDP变量作为解释变量，模拟各产业增加值，再依据各产业增加值计算出各产业增加值的增长率，最后，求出各产业增加值增长率加权之和，得到GDP增长率。此方法得到的GDP增长率，明显高于统计增长率和按能源消费模型、ARMA模型以及非GDP核算变量模型计算的GDP增长率。这表明，各次产业增加值数据与GDP之间应有的内在关系被破坏了，说明GDP数据和各产业数据受到了人为的“污染”，因而失去数据间应有的内在关系（见图7-2）。

图7-2　基于非GDP核算变量模拟的GDP增长率

（5）各种模型模拟的GDP序列具有较强的波动性，而且波动样式基本相同，而GDP统计增长率则更为平稳，表明GDP统计增长率存在着经过人为“加工”处理的可能性。

（6）各次产业增值增长率的算术平均值，与加权平均值以及依其他模型模拟的GDP计算的GDP增长率具有非常相似的波动样式，而且并没有系统地低于统计增长率，这与GDP增长率的核算理论相矛盾，表明GDP增长率与各产业增加值增长率受到了扭曲性加工。

第六节　经济增长、全要素生产率与GDP核算误差

全要素生产率是技术进步的一个替代性指标。从全要素生产率及其变化的角度，反观GDP及其增长率是否真实或可信这一逻辑是否成立，依赖于技术进步的性质。如果技术进步是一个相对稳定而且缓慢的演化过程，那么，作为技术进步替代性指标的全要素生产率，在正常情况下，即在没有面临重大自然灾害或天赐良机的情况下，就不会在短期内发生急剧的变化；如果没有非正常情况发生而全要素生产率却发生了急剧变化，一般而言，是产出测量或投入测量出现了问题。但如果恰好面临技术革命或根本性制度变迁时期，则全要素生产率会发生漂移性变化，即从这一时刻起全要素生产率会发生永久性水平的变化。

熊彼特学派认为，技术进步在本质上是远比经济学家通常所承认的更具有累积性和自生性的过程（cumulative and self -generating processes），从经济理论的角度来考察，技术变迁应该被视为一个被动地适应经济力量的压力与信号的领域，特别是通过市场和要素价格这一中介来适应经济力量的压力与信号的领域。换言之，技术进步具有内生的动力性特征。从历史的角度上看，出现过众多标明技术进步方向的一个个不可更改的事件（compulsive sequences），它们展示出了各种技术进步的路径。实际上，在这些技术进步路径之间存在着相互依赖性，联结这些不同技术进步路径的，正是行为者对市场力量的压力和信号的反应（Rosenberg，1969）。

Rosenberg对技术进步机制的这一论述，更明确地表明了时间因素在技术进步中的巨大作用。由于技术进步是对市场力量的压力和信号的反映，那么，这种反映必然是在出现了市场力量的压力和信号之后，此时至少要经历一个生产周期。同时，技术进步的扩散或模仿行为，绝不是人们在一夜之间的共同行动，也必然是一个渐进的、逐步扩大的过程。因此，技术进步必然是一个需要时间的演进过程。

基于这样的事实，本书全面研究了全要素生产率的核算方法，并利用数据包络分析方法，实证地计算了典型省份及各次产业全要素生产率的相对有效性及全要素生产率的增长，目的是通过观察全要素生产率的变化反观地区生产总值及各次产业增加值核算数据的可信性。实证计算结果表明：

（1）典型省份全要素生产率相对有效性的最佳生产前沿面由1984年、1994年和2004年的全要素生产率构成。这可能是由于经济核算数据从1984年开始出现了问题，并形成了水平效应，即一直影响以后各年的地区生产总值的总量水平；1993年经济增长率再次被高估，并同样形成了水平效应，导致1994年的经济总量被放大；此后的增长率产生了累积性效应，因而使1996年和2004年的全要素生产率处于最佳生产前沿面上。

（2）全要素生产率增长率超出5%～6%的总计有7个年份，分别发生在1983～1984年、1990～1991年、1991～1992年、1992～1993年、1993～1994年、2002～2003年和2003～2004年，增长幅度分别为14%、7%、9%、12%、8%、15%和16%。全要素生产率增长率超出正常范围较多（≥9%）的有5个年份，而且这5个年份全要素生产率的超正常增长，与上面显示的最佳生产前沿面具有内在一致性。1984年全要素生产率处于最佳生产前沿面上，源于1983～1984年技术进步的超正常增长（增长率为14%）；1994年全要素生产率处于最佳生产前沿面上，源于1990～1991年、1991～1992年、1992～1993年和1993～1994年技术进步的持续超正常增长；而2004年全要素生产率处于最佳生产前沿面上，源于2002～2003年和2003～2004年连续两年技术进步的超正常增长。

（3）第一产业全要素生产率的增长率的计算结果表明，1983～1984年、1993～1994年、2003～2004年的全要素生产率的增长率，超出了技术进步的合理范围标准，分别达到23%、10%和11%。很明显，这一结果表明，1994～1996年和2004年处于全要素生产率最佳生产前沿面上，是由于1993～1994年、2003～2004年全要素生产率过快增长的结果。从这一角度看，第一产业1983～1984年、1993～1994年、2003～2004年的增加值增长率的核算存在过高的可能性。同时，也说明地区生产总值增长率在相应期间的过快增长，受到了第一产业增加值过快增长的影响。

（4）第二产业全要素生产率在1991～1992年、1992～1993年和2003～2004年的增长率，分别达到18%、14%和11%。这样高的增长率是令人怀疑的，因此，与这些年份相对应的第二产业增加值的增长率也是值得怀疑的。同时，这些令人怀疑的增长率所对应的年份与经济总体的增长率所对应的年份具有内在的一致性。这说明，这些令人怀疑的第二产业增加值增长率直接导致了令人怀疑的地区总产值在相应年份的增长率。

（5）1979～1980年、1981～1982年、1984～1985年、1992～1993年与2002～2003年的第三产业全要素生产率的增长率分别为12%、18%、22%、12%和23%。显然这些增长率已经超出了正常范围之外。如果说早期的高速增长，即1979～1980年、1981～1982年和1984～1985年，是由于多方面因素，特别是制度方面的因素所导致的，因而具有一定的合理性的话，那么，1992～1993年与2002～2003年的超常规增长，就很难找到恰当的解释，而且正是这两年的超常规增长，导致了1994年和2004年的第三产业全要素生产率处于最佳生产前沿面上。第三产业全要素生产率在此间的超常规增长令人怀疑，并成为导致令人怀疑的相应年份地区生产总值增长率的构成因素。

第七节　GDP统计数据的内在矛盾及其修正

前面我们在对各种数据进行平稳性和协整性检验的基础之上，构建了模拟GDP的能源消费模型、自回归移动平均模型、基于非GDP核算变量模型以及模拟各次产业增加值的非GDP核算变量模型，并依据模拟的GDP及三次产业增加值，计算了相应的增长率。计算结果表明：

（1）以非GDP变量作为解释变量，模拟各产业增加值，再依据各产业增加值计算出各产业增加值的增长率，最后，求出各产业增加值增长率加权之和，得到GDP增长率。此方法得到的GDP增长率，明显高于统计增长率和按能源消费模型、ARMA模型以及非GDP核算变量模型计算的GDP增长率。这表明，各次产业增加值数据与GDP之间应有的内在关系被破坏了，说明GDP数据和各产业数据受到了人为的“污染”，因而失去数据间应有的内在关系。

（2）各种模型模拟的GDP序列具有较强的波动性，而且波动样式基本相同，而GDP统计增长率则更为平稳，表明GDP统计增长率存在着经过人为“加工”处理的可能性。

（3）各次产业增加值增长率的算术平均值与加权平均值以及依其他模型模拟的GDP计算的GDP增长率具有非常相似的波动样式，而且并没有系统地低于统计增长率，这与GDP增长率的核算理论相矛盾。这表明GDP增长率与各产业增加值增长率受到了扭曲性加工。

然而，上述只是根据各种模型模拟的增加值计算的增长率之间的关系，通过理论分析和对比分析得出的初步结论，或者说上述只是一种理论猜测。要证实这种理论猜测的正确性，必须要获得进一步的证据。为此，我们利用数据挖掘技术，对典型省份经济总量及其增长率数据的内在结构进行分析，结果发现：

（1）典型省份GDP总量上存在不一致的问题，即按GDP增长率计算的GDP总量与按各产业增加值之和计算的增加值总量存在较大的差异，而且差异越来越大。

（2）GDP结构上存在问题，即典型省份第二产业增加值自1993年起超过了典型省份GDP，而且即使以三次产业增加值之和为基础计算三次产业间的比例关系，结果与典型省产业结构的实际状况也是相矛盾的。

（3）经济增长速度存在问题。典型省份GDP增长率与按三次产业增加值之和计算的增加值增长率、按三次产业增加值增长率的加权平均计算的总增加值增长率之间，存在较大的差别。

本书利用GDP及各产业增加值模拟模型，依据变量间协整关系，重新估计了典型省份GDP及各产业增加值的增长率，估计出的数据不仅不存在上述各种矛盾，而且从产业结构上看，更符合典型省经济的实际状况。

然而，本书的模拟模型是建立在约束回归下的模型，存在低估各种增长率的可能性，但究竟会低估到什么程度，现在还没有证据来说明。不过，本文估计的典型省份经济增长率，与其他学者利用标准的GDP核算方法估计的中国经济增长率相比，均要略高一些，特别是高于麦迪森（Maddison，1998，Table C-5）、任若恩（Ren，1997，Table 5.3）、亚当斯—陈（Adams和Chen，1996，Table 4）、伍晓鹰（2000）和阿尔温·扬（Young，2000）等人对中国经济增长率的估计。如果说，典型省份的经济增长率高于中国各地的平均水平是客观事实的话，那么，本书估计的可信性，可从这一对比中得到一些认证。同时，如果认为本书的确系统地低估了典型省的经济增长率，那么，可对估计增长率做等比例的上调，这样既可以保持数据间的一致性以及产业结构间的一致性，又能够准确地估算典型省份的经济总量水平和发展速度。

无论如何，在没有获得进一步的证据之前，我们无法给出本书的估计是正确的这一结论。我们更愿意将本书的估计作为进一步研究典型省份经济增长数据乃至其他省经济增长数据的一个开端，因为典型省份GDP统计数据中存在的各种问题，恐怕在其他地方也同样存在。

第八节　进一步研究展望

本书确定了检验中国经济增长数据可信性的相关模型和方法。实证检验结果表明，这些模型和方法能够比较有效地发现相关数据中存在的问题，达到了预期的研究目的。我们认为，在典型省发现的相关问题，恐怕在其他省也存在，因此建议对该问题进行深入的研究。研究方向为：一是运用本研究所确定的模型与方法去检验其他省的相关数据，并将没有进行实证检验的模型进行检验，以便为相关结论提供支持和佐证；二是挖掘新的方法，例如，数据异常值检验方法、间断协整方法等；三是通过构建内生增长模型来检验相关数据。

本书只是一个探索性研究，相关结论有待进一步检验。本书只是在探索和提供检验中国经济增长数据可信性方法与模型方面进行了最初的尝试，希望能够起到抛砖引玉的作用，引起更多学者的兴趣，使更多的学者加入到这一行列中来，为中国社会问题的研究，为中国公共政策的制定，提供更为准确的数据，为探索适合中国的社会科学理论做一些基础性的研究工作。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

工作计划

年度工作

工作规划

教学计划

实施方案

工作方案

教学工作

发展计划

德育工作

管理工作

发展规划

工作总结

教育工作

体育教师

年度计划

后勤工作

安全教育

工作思路

教育计划

小学教师

幼儿教师

数学教师

食品安全

英语教学

中国经济增长数据检验：问题、研究与结论

相关推荐

中国经济增长数据检验：问题、研究与结论

相关文章：

相关推荐