首页 理论教育 大学计算机基础:大数据应用概述

大学计算机基础:大数据应用概述

时间:2023-11-19 理论教育 版权反馈
【摘要】:据IDC预测,到2020年全球将总共拥有35ZB的数据量。·阿里巴巴拥有交易数据和信用数据。在安防与防灾领域,通过大数据的挖掘,可以及时发现人为或自然灾害、恐怖事件,提高应急处理能力和安全防范能力。·采集个人数据应该明确分类,除了国家立法明确要求接受监控的数据外,其他类型数据都由用户自己决定是否被采集。·数据的使用将只能由用户进行授权,数据中心可帮助监控个人数据的整个生命周期。

大学计算机基础:大数据应用概述

1.互联网的大数据

互联网上的数据每年增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。据IDC预测,到2020年全球将总共拥有35ZB的数据量。互联网是大数据发展的前哨阵地,随着WEB 2.0时代的发展,人们似乎都习惯了将自己的生活通过网络进行数据化,方便分享以及记录并回忆。

互联网上的大数据很难清晰的界定分类界限,我们先看看BAT(百度阿里巴巴腾讯)的大数据:

·百度拥有两种类型的大数据:用户搜索表征的需求数据;爬虫和阿拉丁获取的公共Web数据。搜索巨头百度围绕数据而生。它对网页数据的爬取、网页内容的组织和解析,通过语义分析对搜索需求的精准理解进而从海量数据中找准结果,以及精准的搜索引擎关键字广告,实质上就是一个数据的获取、组织、分析和挖掘的过程。

·阿里巴巴拥有交易数据和信用数据。这两种数据更容易变现,挖掘出商业价值。除此之外阿里巴巴还通过投资等方式掌握了部分社交数据、移动数据,如微博和高德

·腾讯拥有用户关系数据和基于此产生的社交数据。这些数据可以分析人们的生活和行为,从里面挖掘出政治社会、文化、商业、健康领域的信息,甚至预测未来。

信息技术更为发达的美国,除了行业知名的类似Google,Facebook外,已经涌现了很多大数据类型的公司,它们专门经营数据产品,比如:

·Metamarkets:对Twitter、支付、签到和一些与互联网相关的问题进行了分析,为客户提供了数据分析支持。

·Tableau:主要集中于将海量数据以可视化的方式展现出来。

·ParAccel:他们向美国执法机构提供了数据分析,比如对有犯罪前科的人进行跟踪,从而向执法机构提供了参考性较高的犯罪预测。

·GoodData:主要面向商业用户和IT企业高管,提供数据存储、性能报告、数据分析等工具。

·TellApart:和电商公司进行合作,根据用户的浏览行为等数据进行分析,锁定潜在买家。

·DataSift:收集并分析社交网络媒体上的数据,帮助品牌公司掌握突发新闻的舆论点,并制定有针对性的营销方案。

·Datahero:将复杂的数据变得更加简单明了,方便普通人去理解和想象。

举了很多例子,这里简要归纳一下,在互联网大数据的典型代表性包括:

·用户行为数据(精准广告投放、内容推荐、喜好分析、产品优化等)。

·用户消费数据(精准营销、信用记录分析、活动促销、理财等)。(www.xing528.com)

·用户地理位置数据(O2O推广,商家推荐,交友推荐等)。

·互联网金融数据(P2P,小额贷款,支付,信用,供应链金融等)。

·用户社交等UGC数据(趋势分析、流行元素分析、受欢迎程度分析、舆论监控分析、社会问题分析等)。

2.政府的大数据

在国内,政府各个部门都握有构成社会基础的原始数据,比如,气象数据,金融数据,信用数据,电力数据,煤气数据,自来水数据,道路交通数据,客运数据,安全刑事案件数据,住房数据,海关数据,出入境数据,旅游数据,医疗数据,教育数据,环保数据等等。这些数据在每个政府部门里面看起来是单一的,静态的。但是,如果政府可以将这些数据关联起来,并对这些数据进行有效的关联分析和统一管理,这些数据必定将获得新生,其价值是无法估量的。

具体来说,现在城市都在走向智能和智慧,比如,智能电网、智慧交通、智慧医疗、智慧环保、智慧城市,这些都依托于大数据,可以说大数据是智慧的核心能源。在城市规划方面,通过对城市地理、气象等自然信息和经济、社会、文化、人口等人文社会信息的挖掘,可以为城市规划提供决策,强化城市管理服务的科学性和前瞻性。在交通管理方面,通过对道路交通信息的实时挖掘,能有效缓解交通拥堵,并快速响应突发状况,为城市交通的良性运转提供科学的决策依据。在舆情监控方面,通过网络关键词搜索及语义智能分析,能提高舆情分析的及时性、全面性,全面掌握社情民意,提高公共服务能力,应对网络突发的公共事件,打击违法犯罪。在安防与防灾领域,通过大数据的挖掘,可以及时发现人为或自然灾害恐怖事件,提高应急处理能力和安全防范能力。

3.企业的大数据

企业的管理者们最关注的还是报表曲线的背后能有怎样的信息,他该做怎样的决策,其实这一切都需要通过数据来传递和支撑。在理想的世界中,大数据是巨大的杠杆,可以改变公司的影响力,带来竞争差异、节省金钱、增加利润、愉悦买家、奖赏忠诚用户、将潜在客户转化为客户、增加吸引力、打败竞争对手、开拓用户群并创造市场。

4.个人的大数据

个人的大数据简单来说,就是与个人相关联的各种有价值数据信息被有效采集后,可由本人授权提供第三方进行处理和使用,并获得第三方提供的数据服务。

未来,每个用户可以在互联网上注册个人的数据中心,以存储个人的大数据信息。用户可确定哪些个人数据可被采集,并通过可穿戴设备或植入芯片等感知技术来采集捕获个人的大数据,比如,牙齿监控数据,心率数据,体温数据,视力数据,记忆能力,地理位置信息,社会关系数据,运动数据,饮食数据,购物数据等等。用户可以将其中的牙齿监测数据授权给医院使用,由他们监控和使用这些数据,进而为用户制订有效的牙齿防治和维护计划;也可以将个人的运动数据授权提供给某运动健身机构,由他们监测自己的身体运动机能,并有针对的制定和调整个人的运动计划;还可以将个人的消费数据授权给金融理财机构,由他们帮你制定合理的理财计划并对收益进行预测。当然,其中有一部分个人数据是无需个人授权即可提供给国家相关部门进行实时监控的,比如罪案预防监控中心可以实时的监控本地区每个人的情绪和心理状态,以预防自杀和犯罪的发生。

以个人为中心的大数据有这么一些特性:

·数据仅留存在个人中心,其他第三方机构只被授权使用(数据有一定的使用期限),且必须接受用后即焚的监管。

·采集个人数据应该明确分类,除了国家立法明确要求接受监控的数据外,其他类型数据都由用户自己决定是否被采集。

·数据的使用将只能由用户进行授权,数据中心可帮助监控个人数据的整个生命周期。

由于各种原因,个人数据中心只是一种理想的规划,大型互联网企业对大数据的无限渴求会阻止数据个人中心的实现,未来必然会有一场激烈的博弈:到底是数据重要还是隐私重要,是以商业为中心还是以个人为中心。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈