“大数据”(Big Data)是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。近年来大数据可谓炙手可热,成为众人瞩目的焦点。网络、电视节目、期刊报纸……无不言他。有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。“得数据者得天下”,对于很多行业而言,如何利用这些大规模数据是赢得竞争的关键,在互联网创业方面也是如此。尤其对于那些面临互联网压力之下必须转型的传统企业而言,如何与时俱进充分利用大数据的价值更是他们必须认真思考的问题。
● 扶持政策
2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。
《纲要》明确,推动大数据发展和应用,在未来5—10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。
《纲要》部署了三方面主要任务。一要加快政府数据开放共享,推动资源整合,提升治理能力。大力推动政府部门数据共享,稳步推动公共数据资源开放,统筹规划大数据基础设施建设,支持宏观调控科学化,推动政府治理精准化,推进商事服务便捷化,促进安全保障高效化,加快民生服务普惠化。二要推动产业创新发展,培育新兴业态,助力经济转型。发展大数据在工业、新兴产业、农业农村等行业领域的应用,推动大数据发展与科研创新有机结合,推进基础研究和核心技术攻关,形成大数据产品体系,完善大数据产业链。三要强化安全保障,提高管理水平,促进健康发展。健全大数据安全保障体系,强化安全支撑。
● 创业方向基于“用户画像”的互联网零售业。在互联网冲击下,大部分传统零售商必须要做出改变,大数据体系下的用户思维便成为符合其需求的一种互联网思维方式和实际体验。那么,何为大数据体系下的用户思维呢?其实就是以“用户画像”为核心和基础,通过线上、线下,交易、交互等各种结构化和非结构化的数据,让用户更加完整地展现在企业面前:该用户是谁?她在哪里?怎么联系到她?她需要什么产品?她通过哪些渠道购买商品?她的购买习惯是怎样的?……在完整的用户画像面前,零售企业相当于面对“裸泳”的用户:用户需要什么,怎么获取,怎么营销一目了然。大数据时代的来临,让用户画像有了基础,用户画像的完善更让零售商有了连接线上和线下,用互联网方式进行商业运营的可能,传统零售商互联网运营管理的时代也已悄然来临。用户画像的示例如图6-6所示。
资料链接
大数据在京东的典型应用:京东用户画像技术曝光[10]
请思考:
(1)为什么要做用户画像?
(2)用户画像怎么做?
(3)用户画像怎么用?
【法理分析】随着大数据应用的发展,隐私保护的问题和概念也在不断地发展,网络用户在互联网的评论、图片、视频、个人信息、兴趣爱好、交易信息、访问的网站等均被企业记录在案。企业掌握了大量消费者的行为数据,对大数据进行整合和分析,从而可以发现新的商机,创造新的价值。然而,这些数据经常包含消费者的真实信息,如在淘宝网上交易时的真实姓名、家庭住址以及银行账号等重要的真实信息,逐渐引起了人们对个人隐私的担忧。正如美国著名的计算机专家迪博德所言,在信息时代,计算机内的每一个数据、每一个字节,都是构成一个隐私的血肉。信息加总和数据整合,对隐私的穿透力不仅仅是“1+1=2”的,很多时候是大于2的。因此,针对隐私保护方面的问题,电子商务企业应该恪守行业道德,不能将消费者的个人信息进行交易和泄露,国家也应该尽快制定并完善与之相应的隐私保护方面的法律和法规,切实保护公民的隐私权。
图6-6 用户画像示例
大数据金融。大数据金融是指集合海量非结构化数据,通过对其进行实时分析,可以为互联网金融机构提供客户全方位信息,通过分析和挖掘客户的交易和消费信息掌握客户的消费习惯,并准确预测客户行为,使金融机构和金融服务平台在营销和风控方面有的放矢。
对于P2P网贷行业而言,能否利用互联网技术有效地搜集用户信息,并对用户的信用信息进行判定和管理,成为考量一家P2P网贷平台风控水平的重要标准。例如,某P2P小额信贷机构应使用个人及机构的外部数据建立自己的征信系统,在极其有限的客户实质接触基础上仅凭问卷数据、自有数据库等对不同客户进行信用评估,并结合内部业务数据建立风险定价系统、风险预警系统、风险管控方案、应对欺诈规则、惩罚方案等一系列影响核心业务盈利能力的系统方案。未来,依托于互联网大数据技术的发展,相信将会出现更优质、更便捷的P2P网贷服务,来帮助更多有信用的借款人释放信用的价值,让信用生金。
大数据医疗。乔布斯自罹癌至离世长达8年之久,这几乎创造了胰腺癌历史上的奇迹。据悉,乔布斯曾在此期间支付大量费用获得了自己包括整个基因密码在内的数据文档。借此,医生们能基于乔布斯的特定基因组成以及大数据按所需效果用药,并调整医疗方案。如果上述案例是个体的,那么带来群体价值的案例便是Google成功预测流感爆发期。2009年甲型H1N1流感爆发几周前,Google通过对人们网上搜索记录的观察、分析、建模,结果显示,他们的预测与官方数据的相关性高达97%,且判断比疾控中心更及时。从个人健康管理到公共健康管理,大数据在对个人医疗的改变以及极富价值的预警能力方面吸引着IT巨头们迫不及待与医疗联姻。例如,2015年5月支付宝钱包发布“未来医院”计划;6月,微信上线首家“全流程就诊平台”;7月,百度与北京市政府共同发布“北京健康云”平台——BAT凭借着技术优势和庞大用户量,纷纷与医院、政府合作,推进移动医疗在“最后一公里”落地。(www.xing528.com)
业内人士认为:(1)大数据、互联网与医疗健康服务的核心学术模式将给医疗卫生行业带来巨大的变革,线上医医交互、医患交互、患患交互模式不断拓展,信息传播的效能不断扩大,政策法规、从业模式也将倒逼重构。(2)未来移动医疗厂商还应通过O2O的方式,与传统的医疗体系打通融合,“打造一站式的医疗服务平台,不断优化用户体验”。
随着医疗领域移动应用的开展,医疗卫生数据共享带来的医疗责任认定、隐私保护等问题却在日益凸显。为预防相关法律风险,创业组织应当注意以下四个问题:(1)必须保证上线医生达到国家要求的准入资格,如果国家尚未出台有关上线医生的具体准入标准,则必须达到医师执业的最低标准,即审核上线医生执业证书的真实性。(2)必须保证每一张电子处方具有可追溯性,包括可追溯到具体的医生和具体的病人。(3)必须保证电子数据最后的不可更改性和永久性。所谓最后的不可更改性,是指医疗行为完成后,电子数据不得再行更改,即使之前的更改,也应当保留每次更改前的原始数据;所谓永久性,是指与医疗行为有关的电子数据应当保存相当时间,至少应当符合《病历书写规定》的保存时间。(4)必须保证医疗电子数据的录入时间与实际医嘱完成时间相一致,故最好与国家授时中心连接。以上四点,是保证一旦因线上诊疗行为发生争议,便于医患双方以及国家有关部门调取相关证据。如果互联网医疗服务企业存在上述瑕疵,很有可能成为医疗侵权诉讼之共同被告。
基于大数据的制造业。工业4.0时代正扑面而来。这是继以蒸汽机、大规模流水线生产和电气自动化为标志的前三次工业革命之后的第四次工业革命。其特点是通过充分利用嵌入式控制系统,即物理信息融合系统(其中大数据扮演主角),实现制造业向智能化转型。然而,中国制造业面对云蒸霞蔚的移动互联网和大数据景观却有些不知所措,若不赶紧扭转局面,有可能逐渐丧失制造业大国的地位。大而不强是我们的软肋,大多数中国工厂依然龟缩在产业链低端,缺少制造的核心材料、设备、工艺,停留在近乎原始的OEM(贴牌代工)阶段,缺乏原创技术和创新产品。不过,凭借庞大的内需市场支撑,中国制造的优势尚存,13亿人口积累的消费数据十分可观。因此,如果能在大数据挖掘和分析上下点功夫,中国制造业还能保持较强的竞争力。
在中国制造业依托大数据打翻身仗的阵营中,小米可谓特立独行的领头羊。2010年成立的小米公司是中国制造业企业的成功典范,其主打产品小米手机已蜚声海外,被业内视作苹果、三星的潜在威胁。小米超越同行的业绩,缘于其用包括软件、硬件和应用生态的整体方法,小米在创造全新用户体验的同时,高擎大数据的旗帜,颠覆了中国制造业公司的传统做法。有了这样的底气,小米董事长雷军才敢与传统制造业的空调玫瑰——格力掌门人董明珠立下10亿元的对赌承诺。
延伸阅读
大数据的应用逻辑[11]
累了吗?让脑袋休息一下,扫描如下二维码,了解更多课后内容。
● 创业潜在法律风险
“大数据”模式的首要法律问题:数据本身的法律属性。大数据所撷取的数据可能是不受著作权保护的时事新闻,也可能是享受著作权保护的文字作品。那么,文字作品的著作权或者传播者权如何保护?如果一个大数据平台是以商业目的对文字作品进行使用,恐怕需要取得著作权人或传播者权人的“使用许可”。具体取得方式可以是“征求著作权人或传播者权人的同意”或者“支付著作权或传播者权的对价”。
“大数据”模式的合法性问题:系于大数据的取得方式。就互联网数据而言,目前主要的取得方式是利用“蜘蛛程序”(也叫“网络爬虫”)自动搜索并抓取数据。这种技术有一个专门的协议,即“robots协议”(也叫“爬虫协议”“机器人协议”)。该协议要求所有网站在其站点的根目录下放置一个“robots.txt”文件。该文件告诉搜索者本站点哪些数据可以被“抓取”。如果站点根目录下没有这个文件,则被视为“本站点内所有没有口令保护的数据都可以被抓取”。这就意味着如果有人突破“robots协议”范围抓取网站数据就要承担“侵犯数据”的法律责任。
“大数据”模式的风险程度:使用目的不同而各不相同。“大数据”模式的使用目的不同,法律规制的要求自然不同。创业组织以商业目的利用“大数据”模式进行生产、经营的,应当严格保护数据权利人的合法利益,不得随意侵犯数据所附有的著作权、隐私权等权利。然而,对于非商业目的利用“大数据”的行为,则应区别对待。比如,个人或科研部门以学习、研究为目的对“大数据”进行撷取、分析的,政府或司法机关以行政决策或打击犯罪为目的对“大数据”进行撷取、分析的,则需要对数据权利进行必要的限制。当然,这种限制是相对的,绝不是说相关部门和人员可以随意侵犯数据权利人的合法权益。
“大数据”模式的法律风险列举。
(1)数据安全和数据定价风险:深度挖掘客户的大数据、开发出客户潜在需求和合适的金融产品。
(2)创新与声誉风险:雾霾险、摇号险、脱光险……网上类似的所谓创新保险产品还在继续不停地产生和发酵,这些创新产品显然违背了保险的宗旨,对行业声誉的建立只能是自黑。
(3)信用与网络欺诈风险:如保监会发布了《关于防范利用网络实施保险违法犯罪活动的通知》,要求各保险机构加强对互联网保险的风险管控,做到主动加强安全防护。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。