首页 理论教育 数据处理的科学原则和方法

数据处理的科学原则和方法

时间:2023-06-04 理论教育 版权反馈
【摘要】:陈诗一提出了克服工业行业分类标准前后不一致、工业经济指标统计口径发生变化、指标数据缺失较多等问题的科学合理的原则与方法,是目前最细致、最全面的调整方法,估算出中国工业1980—2008年38个行业的相关指标数据。本文也是主要仿照陈诗一提出的原则与方法进行调整,只是既为了提高变量指标的准确性,又为了延长考察期限,使变量指标前后可比,本文在数据处理上没有拘泥于前人的做法,做了一些灵活处理。

数据处理的科学原则和方法

本文考察中国工业2000—2014年35个分行业,除特别说明外,数据均来源于2001—2015年的《中国工业(经济)统计年鉴》和《中国科技统计年鉴》,相关年份的《中国统计年鉴》,2004年、2008年、2013年的《中国经济普查年鉴》,《国民经济行业分类2002》(GB/T 4754—2002),《国民经济行业分类2011》(GB/T 4754—2011),其中《中国工业经济统计年鉴2005》没有出版,相关数据从《中国经济普查年鉴2004》中获得。

2000—2014年,中国的工业统计分发生了行业的拆分与归并,统计口径发生较大变化,数据也存在缺失。舒锐(2013)以1998—2010年的中国工业为研究对象,认为全部国有及规模以上非国有工业企业、规模以上工业企业、大中型工业企业三个统计口径的主体相同,差异部分比例较小,且权重难以估量,所以没有区分三个统计口径。陈诗一(2011)提出了克服工业行业分类标准前后不一致、工业经济指标统计口径发生变化、指标数据缺失较多等问题的科学合理的原则与方法,是目前最细致、最全面的调整方法,估算出中国工业1980—2008年38个行业的相关指标数据。孙早和刘李华(2016)主要仿照陈诗一(2011)的调整方法进行调整,估算期间为1990—2013年,认为一方面没有合适的口径调整比例,另一方面2007年以后的规模以上工业企业在全部工业所占的很大比重使其能够反映工业的整体情况,因此没有对2007年以后的数据进行调整。本文认为2013年中国工业统计口径、行业标准做出较大调整,所以有必要对2007—2014年的工业数据进行调整,否则有失准确。本文也是主要仿照陈诗一(2011)提出的原则与方法进行调整,只是既为了提高变量指标的准确性,又为了延长考察期限,使变量指标前后可比,本文在数据处理上没有拘泥于前人的做法,做了一些灵活处理。

1.行业归并与缺失数据处理原则

《国民经济行业分类》(GB/T 4754)最早实施于1984年,后于1994年、2002年、2011年经过三次修订,其中2002年、2011年的修订所颁布的工业行业分类标准分别在2004年、2013年的统计年鉴里被使用。《中国工业经济统计年鉴》在2013年更名为《中国工业统计年鉴》。本文的研究时间跨度是2000—2014年,所以涉及2002年、2011年的行业分类标准调整,其中2011年的修订对本文的数据处理影响最大。《中国工业统计年鉴》(2013—2015年)将橡胶制品业、塑料制品业合并为橡胶和塑料制品业,因此本文将2000—2011年的橡胶制品业、塑料制品业的相关数据指标进行加总得到橡胶和塑料制品业的相关指标数据,以与2012—2014年的行业分类标准相一致。《中国工业统计年鉴2013》将交通运输设备制造业分为汽车制造业与铁路船舶航空航天和其他运输设备制造业,因此为了保持数据前后的一致性和准确性,本文将2012—2014年的汽车制造业与铁路、船舶、航空航天和其他运输设备制造业的相关数据加总归并为交通运输设备制造业。此外,本文没有提及的少量缺省数据一般都采用均值或线性插值方法补充。

所以本文最终估算了35个工业二位码行业[4]2000—2014年的相关数据,共获得525个观察值。(www.xing528.com)

2.工业统计口径调整方法

工业统计口径在考察期间也发生较大变化。《中国统计年鉴2012》第14章工业统计中的简要说明:“本篇资料的统计范围1998年至2006年为全部国有和年主营业务收入500万元及以上的非国有工业企业;2007年至2010年为年主营业务收入500万元及以上的工业企业(即规模以上工业企业);从2011年开始,为年主营业务收入2 000万元及以上的工业企业(即规模以上工业企业)。”《中国工业(经济)统计年鉴》《中国科技年鉴》与《中国统计年鉴》的工业统计口径是一致的。本文参照陈诗一(2011)的做法,将考察期限内规模以上、大中型工业企业按照一定标准调整到全部工业口径。

在构造全部工业统计口径的分行业面板数据时[5],根据《关于印发中小企业标准暂行规定的通知》(国经贸中小企〔2003〕143号)和《关于印发中小企业划型标准规定的通知》(工信部联企业〔2011〕300号)的规定,兼顾研究目的和数据可得性,本文选择以从业人数、主营业务收入作为口径调整的指标,用从业人数指标调整得到的全部工业口径的数据用于本文的基准回归结果分析(j=1),用主营业务收入指标调整得到的全部工业口径的数据做稳健性检验(j=2)。与陈诗一(2011)的做法一样,本文首先分别计算出2004年、2008年、2013年分行业规模以上工业企业的从业人数、主营业务收占全部工业口径的比重,然后通过线性假定可以计算出2000—2014年分行业规模以上调整到全部工业口径的调整比例,最后将规模以上的相关指标数据除以对应年份的调整比例得到2000—2014年全部工业口径的相关指标数据。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈