首页 理论教育 数据来源与处理:如何有效利用数据?

数据来源与处理:如何有效利用数据?

时间:2023-06-12 理论教育 版权反馈
【摘要】:本章使用中国创业板上市公司作为样本公司。样本数据主要由两部分组成,一部分是通过对中国知识产权数据库进行网络爬虫得到样本公司的专利信息,另一部分是样本公司的董事长信息和财务数据,来自万德数据库。图17-1数据处理流程

数据来源与处理:如何有效利用数据?

本章使用中国创业板上市公司作为样本公司。样本数据主要由两部分组成,一部分是通过对中国知识产权数据库进行网络爬虫得到样本公司的专利信息,另一部分是样本公司的董事长信息和财务数据,来自万德(WIND)数据库。

对于专利数据的处理主要采取以下步骤:首先,利用网络爬虫程序,将样本公司名称作为关键字对中国知识产权局数据库进行数据采集,得到样本公司拥有的专利名称、公开号、公开日期、发明人、申请人等详细信息;其次,对各专利的发明人按排名次序进行拆分,得到样本公司各专利的作者信息等,用于下一阶段与公司数据的匹配。

对于董事长信息和公司财务数据的筛选,先选择2011—2014年创业板上市公司作为初始数据,再按如下标准筛选与选择样本:①以2011—2014年间董事长是否连任作为标准,剔除该期间董事长未连任的公司,因为要观察董事长参与研发专利对于公司业绩的影响,如果出现董事长离任,其拥有的资源、能力和动机会出现变化,则无法观察董事长参与研发的专利对公司业绩的影响;②收集2011—2014年间董事长连任公司的财务数据,剔除财务数据不全的公司。

然后,对样本公司的专利信息和董事长数据进行匹配。将样本公司专利数据和样本公司2011—2014年的董事长数据以专利信息中作者名与董事长名称为条件进行匹配,得出475位董事长参与研发专利的结果,在董事长参与研发的专利信息中,将专利公开号的特征代码作为标准将董事长参与研发的专利细分为发明专利、实用新型专利和外观设计专利,最终共获得1900条样本数据。(www.xing528.com)

实证研究的数据处理流程如图17-1所示。

图17-1 数据处理流程

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈