首页 理论教育 探索大数据世界:13个应用案例全解析

探索大数据世界:13个应用案例全解析

时间:2023-06-13 理论教育 版权反馈
【摘要】:我们从13个应用案例来分析和了解大数据带来的方方面面的影响。中央电视台对大数据的应用开创了国内电视媒体大数据新闻之先河,大数据逐渐被中央电视台统合至综合频道、新闻频道、经济频道等多个强档品牌新闻中。而为了解决空中交通拥堵的问题,巴西引进了一种系统,即利用GPS收集的数据来优化对现有的航空路线的利用效率,缩短飞机航线。它运行在两个数据中心的6个服务器上,目前存储了24TB的数据。

探索大数据世界:13个应用案例全解析

我们从13个应用案例来分析和了解大数据带来的方方面面的影响。这些是大数据在生活中的应用,它们不但能改变一个企业的运营状况,而且还可能改变一个行业未来的走势与发展。

电视媒体

2014春节前夕,中央电视台大数据电视新闻报导“据说春运”最早亮相在《晚间新闻》栏目,一经播出就引起强烈社会关注及热议。随后不久,中央电视台又在春节、“两会”、清明假期等重大新闻时间节点上推出了“据说春运”、“据说两会”、“大数据看出行”等系列报道,积极探索电视媒体大数据新闻的创新模式。中央电视台对大数据的应用开创了国内电视媒体大数据新闻之先河,大数据逐渐被中央电视台统合至综合频道、新闻频道、经济频道等多个强档品牌新闻中。

中央电视台大数据电视新闻仅以2014年1月25日至29日播出的开篇之作“据说春运”为例:截至2月7日,中央电视台新闻新媒体平台(微博、微信、客户端)、新华网、人民网等媒体的官网及新媒体平台转发就已超过1280万篇:新浪网易腾讯网、腾讯新闻客户端、搜狐凤凰、虎嗅网、中新网、新华网、人民网、DoNews、Techweb等网站。

社会生活

印度有一档非常受欢迎的电视节目Satyamev jayate,该节目主要分析社会民众关于争议话题的各种意见,包括女性堕胎、种姓歧视和虐待儿童等社会热点问题,并使用这些数据来推进政治改革。

电视节目不是太多,只播放了13集,但是反馈回来的数据却非常惊人。来自印度电视和世界各地的YouTube上的400万观众,超过1.2亿人在其网站、Facebook、Twitter、YouTube和移动设备上已连接Satyamev jayate;超过800万的人通过Facebook、网络注释、文本消息及电话热线等方式发送14万个回应,每周有超过10万个新观众进行回应。

社交网络

LinkedIn领英是全球最大的职业社交网,而领英建成的一个最重要的数据库是Espresso。这是继亚马逊Dynamo数据库之后的一个最终一致性关键值存储,用于高速存储某些确定数据,Espresso作为一个事务一致性文件存储,通过对整个公司的网络操作将取代遗留的Oracle数据库。

它最初的设计就是为了提供LinkedIn InMail消息服务的可用性,该公司将推出开源Espresso。

公共交通

巴西航空交通发展迅速,预计在2030年年客运量至少增加一倍,旅客人次将达到3.1亿。而为了解决空中交通拥堵的问题,巴西引进了一种系统,即利用GPS收集的数据来优化对现有的航空路线的利用效率,缩短飞机航线。

它的工作原理是:改变了飞机在空中排队等候降落地面的一般性方法,同时为每一架飞机都设计了唯一的路线。听着简单,但实际上需要收集大量的数据才能有效地对系统实施,并对数据进行快速有效的分析,包括对飞机之间的距离、行驶时间、飞机行驶性能等进行综合性评估,以此来保证飞机能够以最短的路线行驶。

最早部署这一系统的巴西利亚国际机场的飞机,每一次降落都将节省7.5分钟和77加仑的燃料,相当于减少22海里的飞行距离。巴西计划将该系统部署到该国最繁忙的10个机场,初步估计这一部署在机场的举措将会为巴西带来16%~59%的客流量的增长,当然,还需要考虑机场硬件设施等各类条件。

医疗行业

美国好莱坞女星安吉丽娜·朱莉,在2013年经过检测发现自身携带致癌基因——BRCA1基因,为防止罹患卵巢癌,于2015年切除了卵巢和输卵管。国内外已经有多家基因检测机构,我国的华大基因、贝瑞和康、美国的23andMe、Illumina公司等。

华大基因一直致力于肿瘤基因组学研究,已经研究20多类癌症。华大基因还推出了自主研究的肿瘤基因检测服务,采用了高通量测序手段对来自肿瘤病人的癌组织进行相关基因分析,对肺癌乳腺癌胃癌等多种常见高发癌症进行早期、无创伤检测。

数据来源主要是对患者进行的检测数据:患者血清、口腔黏膜数据、基因测序等,根据患者体检数据、电子病历、遗传记录、患者调查、地理区域以及生活条件等进行判断。

首先采取患者样本,通过测序得到基因序列,接着采用大数据技术与原始基因比对,锁定突变基因,通过分析做出正确的诊断,进而全面、系统、准确地解读肿瘤药物与突变基因的关系,同时根据患者的个体差异性,辅助医生选择合适的治疗药物,制定个性化的治疗方案,实现“同病异治”或“异病同治”,从而延长患者的生存时间。

癌症诊断和预测。肿瘤医院的病人中有60%~80%刚到医院时就已经进入癌症中晚期,癌症早期的筛查可以帮助患者有针对性地改善生活习惯或者采取个性化的辅助治疗,有益于身体健康;同时将癌症扼杀在摇篮里,从而降低日后巨大的医药开支和生活困扰。

助力个性化医疗。结合生物大数据,挖掘疾病分子机制,最终可以做到更好的筛查,更好的临床指导以及更好用药的过程。

保险行业

大都会保险公司MetLife投资3亿美金建立一个新式系统,其中的第一款产品是一个基于MongoDB的应用程序,它将所有客户信息放在同一个地方。MongoDB汇聚了来自70多个遗留系统的数据,并将它合并成一个单一的记录。它运行在两个数据中心的6个服务器上,目前存储了24TB的数据。这包括MetLife的全部美国客户,尽管它的目标是扩大它的国际客户和多种语言,同时也可能创建一个面向客户的版本。它的更新几乎是实时的,当新客户的数据输入时,就好像Facebook墙一样。

安泰保险正尝试通过大数据达到大多数疾病可以通过药物来达到治疗效果,但如何让医生和病人能够专注参加一两个可以真正改善病人健康状况的干预项目却极具挑战。为了帮助改善代谢综合症患者的预测,安泰保险从千名患者中选择102个完成实验。在一个独立的实验室内,通过患者的一系列代谢综合症的检测试验结果,在连续三年内,扫描60万个化验结果和18万索赔事件。将最后的结果组成一个高度个性化的治疗方案,以评估患者的危险因素和重点治疗方案。这样,医生可以建议患者通过食用他汀类药物及减重5磅等减少未来10年内50%的发病率;或者根据患者目前体内高于20%的含糖量,而建议患者降低体内甘油三酯总量。

零售行业

沃尔玛为其网站Walmart.com自行设计了最新的搜索引擎Polaris,利用语义数据进行文本分析、机器学习同义词挖掘等。根据沃尔玛的说法,语义搜索技术的运用使得在线购物的完成率提升了10%~15%。(www.xing528.com)

沃尔玛采用的北极星搜索引擎主要模仿了Kosmix的语义搜索技术和语义分析技术,前者从用户在社交平台上发出的推特、和其他用户之间的互动行为中挖掘出用户的购物倾向,后者则度量产品之间的相关度和相似度,包括产品、人物、事件之间的关联。

以上两种技术使北极星搜索引擎能够为顾客提供更精准的产品链接,此外北极星在确定产品排名时还引入了顾客的搜索记录。这种解析关键词和挖掘同义词的搜索方法可以给顾客提供更合理的产品,从而提高用户体验。

沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。如今,“啤酒+尿布”的数据分析成果早已成了大数据技术应用的经典案例,被人津津乐道。

音乐领域

音乐元数据公司Gracenote收到来自苹果公司的神秘忠告,建议其购买更多的服务器。Gracenote照做了,而后苹果推出iTunes和iPod,Gracenote从而成为了元数据的帝国。

在车内听的歌曲很可能反映你的真实喜好,Gracenote就拥有此种技术。它采用智能手机平板电脑内置的麦克风识别用户电视或音响中播放的歌曲,并可检测掌声或嘘声等反应,甚至还能检测用户是否调高了音量。这样,Gracenote可以研究用户真正喜欢的歌曲、听歌的时间和地点。

能源行业

阿里云与阳光电源2015年4月公布了战略合作协议,并发布了其第四代电站运行维护管理系统——“智慧光伏云iSolarCloud4.0”。阳光电源依靠其1500个光伏电站的运行维护经验和大数据基础,并通过阿里云提供海量数据的计算、存储和网络连接能力,从而使“智慧光伏云iSolarCloud”成为精细化的光伏电站运行维护管理平台。

阳光电源作为国内最大的光伏逆变器供应商,可以直接将光伏数据采集器集成于光伏逆变器中,这意味着阳光电源将直接掌握光伏数据监控的终端,并且通过与阿里云达成战略合作之后,可以依靠阿里云领先的云计算服务平台,快速步入光伏数据云模式。

光伏电站管理平台对光伏电站实时运行数据监测、自动化管理、收益结算、远程专家咨询和大数据分析。通过建立相关数据库,可以达到电站设备故障安全预警的功能,结合天气环境资料,可实现光伏电站发电量的精准预测。

光伏电站监测、诊断平台可以通过数据采集器导入各类光伏数据,并用可视化的方式呈现,以实现对光伏电站的实时监测的功能。对所监测的光伏数据进行深度挖掘与分析,可以作为光伏行业分析和发展的数据参考,并对光伏电站未来的收益增长、资产评估、风险控制有重要意义。实时监控运行数据大大提高了安全预警的能力,及时解决安全隐患,保障安全生产。

汽车制造

说起汽车的制造过程,大多数人脑子里随即浮现的是各种生产装配流水线和制造机器。然而在福特汽车公司,在产品的研发设计阶段,大数据就已经对汽车的部件和功能产生了重要影响。

福特公司介绍:我们将增加车载摄像头的安装量,车载摄像头能提供高码率的数据,结合其他传感器数据实现各种应用(包括福特与微软联合开发的车载SYNC系统),例如,汽车中已经有了温度、气压、湿度和尾气污染物浓度传感器……想想吧,所有这些传感器数据整合到一起对人们来说意味着无限的可能:提供更精准的天气预测、交通状况预测、提醒哮喘病人绕开某些区域、正确设置汽车空调循环方式。

电子邮件

MailChimp公司的核心业务是提供电子邮件服务,它在一年内为大约300万用户发送了350亿封邮件。不过真正能体现MailChimp未来价值的则是该公司对这些邮件数据的处理和分析。

MailChimp的一个重要任务就是搞清楚如何帮助客户更好地了解他们所发送的信息。考虑到这一点,该公司建立了一个服务叫Wavelength,向客户展示了与他们相似的其他讯息。这个系统使得Wavelength能够储存公司数据库中每个邮件地址发生的互动。这意味着告诉了你,用户打开了什么样的邮件,何时打开,他们点击了什么链接,还订阅了什么邮件。MailChimp也有一个功能叫做Ecommerce360,能让客户通过转换来跟踪点击。

体育赛事

著名的篮球赛事NBA的球队会需要搜集大量数据来分析赛事情况,通过分析这些数据,找到两三个应对策略,或者至少能保证球队获得高分,然而他们还在为这些数据的整理和实际意义而发愁时,Krossover公司应运而生,正致力于此。

在每场比赛过后,教练只需要上传比赛视频。接下来,来自Krossover团队的大学生将会对其分解。等到第二天教练再看昨晚的比赛时,他只需检查任何他想要的——数据统计、比赛中的个人表现、比赛反应等等。通过分析比赛视频,毫不费力地分析所有的可量化的数据。

总统竞选

许多人通过Facebook更新个人状态、分享图片以及他们“喜欢”的内容。奥巴马也通过使用社交网络的各种数据功能完成了竞选,他们不仅通过社交网络寻找支持者,而且还通过社交网络召集了一批志愿军。

Facebook联合创始人克里斯·休斯在2006年就建议扎克伯格(Facebook的创办人)在网站上推出相关服务,帮助总统候选人在Facebook上建立个人主页,以便他们进行形象推广。2006年9月,Facebook全面开放,用户数量爆炸式增长,在年底达到1200万。这一过程恰好有利地推升了奥巴马的知名度。此后,在克里斯的辅佐下,奥巴马掀起了一系列的网络活动,在Facebook、MySpace等社交网站上发表公开演讲、推广施政理念,赢得大量网民支持,募集到5亿多美元的竞选经费。

最终,“黑人平民”奥巴马战胜了实力雄厚的对手,成为美国历史上第一位黑人总统,之后更获得连任。此次选举被认为是美国民主的巨大进步,而互联网则提供了前所未有的实施手段,其中尤以Facebook代表的社交网站最为突出,以致于有人戏称其为“Facebook之选”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈