首页 理论教育 块数据:高度关联的海量数据聚合分析

块数据:高度关联的海量数据聚合分析

时间:2023-05-30 理论教育 版权反馈
【摘要】:(一)块数据的定义到目前为止,人们所讨论和应用的数据几乎都是被某个行业或领域掌握的“条数据”。(二)块数据的特征1.高度关联性就是数据之间彼此连接、相互交错,形成网络状数据连接格局。但是在“块数据”时代,更重要的能力在于对海量数据的聚合分析。

块数据:高度关联的海量数据聚合分析

(一)块数据的定义

到目前为止,人们所讨论和应用的数据几乎都是被某个行业或领域掌握的“条数据”。无论是互联网企业所掌握的电子商务、互联网金融等行业数据,还是传统企业掌握的由银行卡、会员卡所汇聚的企业内部数据,再到各地方政府所做的信息化工程所掌握的卫生、教育交通等部门的数据,都可以定义为“条数据”,即在某个行业和领域呈链条状串起来的数据。

因此,所谓“块数据”,就是一个物理空间或者行政区域内形成的涉及人、事、物的各类数据的总和。具体来讲,可以从三个层次理解:在前端,围绕人、事、物的各类活动产生数据;在中端,通过数据的开放和共享,聚集数据;在末端,以解构、交叉、融合等多种方式,依靠数据抓取、比对、封装等多种技术手段分析数据,寻找更高、更多的实践价值。

(二)块数据的特征

1.高度关联性

就是数据之间彼此连接、相互交错,形成网络状数据连接格局。数据的关联度越高,其价值也就越大。“块数据”的来源可能是一条街道、一片社区甚至是一座城市,人口的关联关系相对清晰,区域的资源整合相对独立,相互之间的关联性更高。

2.立体性

就是呈现多维度结构特征。从物理上看,由“条”到“块”本身就是一个维度增加的过程,这实际上就寓意着数据结构的变化。主要指数据来源的广泛性、数据模式的多元性、数据主体的时空性。由于“块数据”是基于一定区域内所有数据的累积,所以其数据内容非常丰富,既包括该区域内企业、人口、车辆等基本相对静态数据,又包括人员活动路线、消费记录、生活习性等动态数据,两者结合就形成了一个立体化实时更新的数据网络。

3.强活性

随时随地都在更新变化。数据的活性是衡量数据价值尺度的重要指标,这里的活性就是数据的更新率和鲜活度。与“条数据”更新更多发生在增量上有所不同,“块数据”的更新既发生在增量上,也发生在存量上。发生在增量上体现在不断产生新的大量数据,更新频率快、鲜活程度高,能够源源不断地形成新的应用价值。比如,在购物场景里,热门商品价格和库存变化之后,用户可能几分钟之内就下单,需要了解当前最准确的价格和库存信息,这就需要对数据进行实时更新。发生在存量上体现在通过对包括企业、个人的住址、收入、喜好等基本信息数据的变更,来确保数据的颗粒度

4.主体性

以人或物的活动为起源。“条数据”的产生是源自企业的“产品”,即关注某个点,并将所有点尽可能地集中起来,如关注消费者购物场景,将所有购买某一商品的行为集中起来,然后通过分析寻找价值。“块数据”关注的则是围绕“人或物”发生的各类事件的数据总和,强调的是对点、线、面数据的全面集成。比如,依托包括手机在内的智能终端设备,实现了对人基本活动数据的全记录,并在此基础上进行分析,对人形成全面、准确、精细化的勾勒,从而提供更加符合个人喜好和需求的各类商品。比如,依托物联网,将汽车建筑、道路等物体上的传感器记录下来的数据汇聚起来,分析一个区域内的交通、能源使用等各种情况,进而寻找提升公共资源承载能力和运行效率算法。包括人的静态数据、行为数据、意识数据。

5.开放性

打破目前以垄断为主的经营模式。在“条数据”时代,数据本身构成了互联网企业的核心竞争力。所以大家都在不断地获取数据、争抢数据、垄断数据。但是在“块数据”时代,更重要的能力在于对海量数据的聚合分析。通过在不同企业、部门、个人之间建立起数据交换与共享的桥梁和机制,特别是通过重点推动以政府为主体的数据开放和利用,让企业、组织、个人均能够以常态化、免费且便利的方式接近数据、读取数据、利用数据,数据的生命力将最大限度地发挥出来。

(三)块数据的价值

“块数据”本身在地域、行业、人员上的集中带来了更大的规模、更丰富的内容和寻找更多关联性的机会,让“块数据”成为大数据时代的“富集金矿”。

1.商业模式发掘潜力巨大

“块数据”正是源自对人时空活动的详尽记录,将以往那些分散化、碎片化的行业数据、领域数据串联起来,把以往那些“数据孤岛”连成一片。这样可以综合分析出个人消费喜好、生活需求、收入水平等商业要素。特别是找准那些高度个性化、长尾化的市场需求,通过对这些需求的集成和满足,从而产生全新的商业模式。一是围绕数据的汇聚、处理、分析和应用所形成的商业模式;二是颠覆或再造传统商业模式(应用服务、咨询服务等);三是围绕数据交易所形成的商业模式(数据现货、期货交易等)。

2.社会领域应用前景广阔(www.xing528.com)

“块数据”基于对人口管理和服务数据,以及社会治安、城市管理等相关数据的集成,将带来全新的体验和变革,其应用价值与经济领域的应用价值同样巨大。比如,有城市将平台和智能手机连接起来,构建起了一个以地图为基础的可视化平台,实时反馈城市生活中的垃圾、治安、市政、交通等各类问题,并督促相关单位处理这些问题,使城市生活的安全性、便捷性、舒适度提高到一个新的维度。比如,在舆情监控方面,通过网络关键词搜索及语义智能分析,能提高舆情分析的及时性、全面性,有效应对网络突发公共事件,打击违法犯罪

3.促进政府治理模式转型升级

“块数据”迅猛发展,数据只有集成才能实现价值提升,只有共享才能发挥更大价值,只有像商品那样能够交易才能实现更大范围的推广和发展。政府作为重要的数据拥有者、规则制定者和大数据时代的推动者,将扮演新时代的新角色。推动思维升级,即用互联网思维引领工作模式转型升级,加快数据交易、流通平台建设,建立规则、强化监管、科学引导,促进产业良性发展。推动服务升级,在确保数据安全的前提下,建设共享数据平台,为大数据产业发展提供资源、夯实基础。推进管理升级,通过建设成熟配套的法律法规体系确保数据安全、防止数据垄断、实现“O2O”即线上线下法规的有机衔接。

4.为社会公共文化增添新元素

“块数据”对社会成员活动轨迹的全天候、全方位记录和分析将影响社会文化的走向和社会公共价值的形成,弘扬社会正能量。比如将形成诚信文化,数据的极大丰富使得以往不容易被发现的一些不讲诚信、不讲道德行为被记录、被发现的成本大为降低、可能性大为提高,诚信成为优质生活的必然选择。比如将形成共享文化,“块数据”将打破既有数据垄断,通过共享来实现数据价值提升和市场潜力挖掘,共享成为全新的价值导向。比如将形成开放文化,以微博、微信等为主体的各大社交网络媒体为平台,公众对各类社会公共议题的参与程度,信息扩散的速度空前扩大。

通过整合成“块数据”,就可以跳出既有的小圈子,在更广范围、更多数据中去寻找新算法、发现新模式,从而产生主体化的数据,产生高价值链的应用。比如,原来讨论大健康的云计算和大数据分析,主要基于个人历史档案、家庭遗传基因、个人生活习惯,但如果把“块数据”融在一起,气候、温差变化、流行病发病情况、区域饮食习惯特点以及个体突发性公共事件的影响等,这些相关数据融入健康产业发展大数据库之后,就会大大提高大健康数据的含金量。

(四)块数据面临的挑战

与所有新生事物相同,“块数据”在建设与发展的初始期面临诸多困难和挑战。

1.顶层机制设计亟待破局

“块数据”的生命力在于整合,只有通过不断整合才能发挥其应有价值,可以说,整合领域的广泛程度与其价值实现大小成正比。然而,目前“块数据”缺失从安全监管、标准确立、技术支撑、开放体系构建等各个方面建立起的一套规则体系,使得数据整合中还存在通道、清洗、共享、利益分成、隐私保护等方面的问题,“块数据”的发展缺少一个安全、稳定的大环境。

2.数据标准化任重道远

在“块数据”的应用中,实现数据标准化是一大难题。由于收集上来的数据来源是政府、单位、企业甚至是个人,数据格式呈现为音频、视频、文档等,这些不同格式、不同标准的数据挖掘分析的难度很大。目前,还缺少标准制定或数据接口标准转换等,且缺少以数据“录入、处理、结构化、清洗、组配”为重心的各类数据代工企业。数据的标准化、结构化还没有成为社会普遍追寻的目标。

3.数据安全问题日益凸显

与“条数据”相比,“块数据”的安全管控难度更大。“块数据”带来的可能是对整个地区、各个领域、全部行业、所有自然和人文现象的记录、分析、挖掘。这就意味着一旦发生数据泄露,对社会造成的危害会更大,将是对某些人、企业、单位乃至政府信息的全面泄露,可能会对个人隐私、企业机密造成重大伤害。而目前,我们还缺少法律约束、道德自律、技术手段等方面的数据安全保护支撑。

4.保护公民隐私刻不容缓

“块数据”带来的是对个人所有行为的记录,对每个行业条状数据的记录,直至对整个地区、各个领域、全部行业、所有自然和人文现象的记录、分析、挖掘。这就使“世界是透明的”变成了活生生的现实。“块数据”这件“贴心小棉袄”知道你在想什么、你要什么、你能干什么,甚至你的潜意识里想要干什么,这对公民个人隐私带来了极大挑战。第一要强化立法手段,通过法律的方式,确定数据所有权的归属,强化数据存储、传输、使用者的安全责任。第二要强化道德自律,把“数据就是财产,偷盗、侵犯数据就是盗窃、侵犯财产”的观念广泛宣传开来,树立新的数据道德观。第三要强化技术手段,大力发展基于大数据的信息安全相关的声音识别、指纹识别虹膜识别等技术,实现数据的安全和隐私保护。

5.金融市场不稳定性将常态化

“块数据”是一种产生于互联网时代的特殊商品,其交易将更多地通过网络平台进行,数据确权、数据定价、数据保险、数据货币,以及数据的登记、交割等一系列新的金融业态将会产生。由于数据价值的挖掘,面临着人类建立各类金融、证券交易市场以来最大的不确定性,所以失控和不均衡正在成为常态。也就是说,数据货币可能取代实体货币,数据价值可能会成为衡量有价物的一般尺度。甚至在未来,不仅仅是货币,包括证券、期货在内的大量金融工具都将数据化,这使得主权国家央行系统发行货币的模式将受到挑战。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈