首页 理论教育 大数据采集的基础夯实

大数据采集的基础夯实

时间:2023-07-24 理论教育 版权反馈
【摘要】:为此,必须扩大数据覆盖范围,才能准确反映P2P网贷平台运行态势和投资、借款活动的全貌,必须对各要素以及要素之间的关系进行全面挖掘。目前,P2P网贷平台的信息主要由地方金融部门收集,彼此之间无法实现信息对接和数据交换,也缺乏相对统一的数据采集渠道和相对集中的数据存储平台,已经成为制约P2P网贷大数据生成的瓶颈。

大数据采集的基础夯实

第一是从数据的采集模式来看,由专人负责、逐条录入的传统机制与信息化时代的要求不相适应,迫切需要向全员统计、全程统计、数据自动生成的模式转变,相关部门的工作人员实时录入P2P网贷平台的信息,并赋予系统对投资者操作行为动态抓取的功能,对所有操作实时记录存储,生成动态、全面的信息,形成海量数据基础,才能为数据的实时获取、数字传输、高效处理和深度利用提供可能。

第二是从数据的要素构成来看,传统的数据呈现出概要式的特点,与大数据的全面性要求不相适应,如我们于第三方机构的网站上可以查询到某家P2P网贷平台在一天当中的总成交量、资金流入/流出量、当日待还金额、当日投资人数、当日借款人数等,但是我们无法看出资金流入/流出量的高峰时段,或者将资金流出情况与借款人进行匹配。为此,必须扩大数据覆盖范围,才能准确反映P2P网贷平台运行态势和投资、借款活动的全貌,必须对各要素以及要素之间的关系进行全面挖掘。

第三是从数据的管理来看,首先,虽然部分P2P网贷平台开放端口,接入第三方机构,生成可供广大投资者自主查询的数据,但毕竟数据来源于P2P平台,其真实性有待考证,因此,要加强数据真实性管理,规范数据采集渠道,加强地方金融主管部门对属地P2P网贷平台数据的真实性核查,严把数据入口关。其次,对于数据的存储,要达到低成本、低能耗、高可靠性目标,通常要用到冗余配置、分布化和云计算技术,在存储时要按照一定规则对数据进行分类,通过过滤和去重,减少存储量,同时加入便于日后检索的标签。最后,健全信息公开制度,以公开为原则,不公开为例外,以公开促公正,树公信,不公开须由P2P网贷平台进行申请,如确属涉及商业机密等,可以不予公开。(www.xing528.com)

第四是从数据的基础建设来看,多头推进、重复开发的模式与大数据的要求不相适应,迫切需要向更加注重一体建设转变。目前,P2P网贷平台的信息主要由地方金融部门收集,彼此之间无法实现信息对接和数据交换,也缺乏相对统一的数据采集渠道和相对集中的数据存储平台,已经成为制约P2P网贷大数据生成的瓶颈。尤其是金融领域的大数据采集,应当由单纯、被动的一家收集转变为政府主导的、立体化的联合模式,由金融主管部门牵头政府相关部门、人民法院、人民检察院、银监部门、人行、银行等单位(机构)以及P2P网贷平台、第三方机构,建立数据互通、共享、管理、运用的平台,通过统一规划、整合资源,推进数据一体化建设,打破当前多头开发、重复开发的僵局,实现数据的集中存储和管理。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈