首页 理论教育 大数据基建:需关注的问题和解决方法

大数据基建:需关注的问题和解决方法

时间:2026-01-22 理论教育 小霍霍 版权反馈
【摘要】:但是,相对于数据中心的快速建设及信息通信技术的更新迭代速度,数据中心“能效”方面的标准还相对不足,特别是数据中心能效方面的国标和行业标准还有较大欠缺,未能跟上数据中心IT设备的更新速度。因此,需要建立健全数据中心的能耗优化评价指标,以及面向不同等级及气候区域的数据中心能效评价标准。在保证企业经济利益的同时,可以要求其承担更大的个人信息保护和数据安全义务。

数据中心的建设是一项系统工程,从规划到设计,从选址到建筑,从计算机设备到制冷系统,从网络安全到备灾,都需要合理规划,数据中心通常可以运行大约15年。

充分释放现有数据中心的能力的基础上,需要不断改进革新,技术与基础设施保持平衡的推动发展。根据思科数据,预计2016—2021年全球数据中心云流量CAGR(CompoundAnnualGrowthRate,复合增长率)为26.6%,至2021年达到每年19.5ZB,但传统数据中心流量仅有4.8%的复合增长。

完善数据要素的市场化配置,亟须加快培育数据应用服务产业,支持优秀数据服务企业做大做强,通过技术创新、人才培养和市场竞争,提高对政府数据和各类社会数据(公权机构数据、法人私有数据和开源网络数据)的融合分析能力,为各类企业提供高质量的数据应用服务,充分实现数据在经济发展中的资源价值。

一、把握基础设施建设和技术进步的平衡

由于企业很难预测IT系统要求的变化,因此在设计数据中心时存在无法准确计划的一些问题。一方面,企业的整体运营越来越依赖于IT平台,并且这些IT系统的负载在很长一段时间内都不是恒定的,并且随着业务的发展通常会迅速增长。有些公司甚至很难预测一年中业务发展将带来什么系统负载变化。

另一方面,IT系统的触角正在逐渐蔓延到企业业务和管理的各个角落。新的在线系统层出不穷。很难预测何时将旧的管理方法和系统替换为新的方法和系统。另外,IT系统本身变得越来越复杂,不可预测性也越来越强,技术进步和技术的相关应用难以准确预测,一旦发生,数据中心的IT基础架构将无法支持,迫切需要扩展。同样,建议不要为不可预测的负载准备大量冗余。总之,构建数据中心需要合理规划各种链接,以确保数据中心在更经济的状态下运行。

统计,相对于发达国家,目前我国多数数据中心的资源利用率较低。主要原因可归结为,数据中心为了追求高性能、保证服务质量和可靠性,通常采用冗余的设计运行策略。日常大多服务器都处于冗余、待机的运行状态。加之数据中心的发展建设在全国层面不太均衡,导致我国数据中心较低的低资源利用率,导致巨大的资源浪费的同时,也会加重数据中心冷却系统、配电装置等配套设备能耗的投入,致使数据中心的能耗成本可达到数据中心运行成本的50%左右。

出台相关政策或标准,在环保和能耗方面对落地的大型数据中心/云计算中心项目进行严格审批。在满足市场有效需求前提下,积极统筹、合理控制各地据中心的数量和规模,尽可能地优化数据中心可承载的带宽和资源量,尽可能地避免数据中心结构性过剩与业务量不均衡的问题,保证全国数据中心平均利用率的提高。

二、促进数据融会贯通

我国的数据中心经过几十年的发展,也逐渐形成了数据中心的标准体系。现有数据中心能效的相关标准包括:数据中心能源管理效果评价导则、数据中心能源利用测量和评估规、云计算数据中心能效评估方法、数据中心能源管理体系实施指南、数据中心能源效率限额、能效及排放技术要求和评测方法、数据中心制冷与空调设计标准、数据中心资源利用相关:电能能效要求和测量方法、互联网数据中心的能耗测评方法、绿色数据中心评价标准等。

但是,相对于数据中心的快速建设及信息通信技术的更新迭代速度,数据中心“能效”方面的标准还相对不足,特别是数据中心能效方面的国标和行业标准还有较大欠缺,未能跟上数据中心IT设备的更新速度。因此,需要建立健全数据中心的能耗优化评价指标,以及面向不同等级及气候区域的数据中心能效评价标准。

由于当前行政管理体制“条块分割”,政务数据资源由各部门独自管理,导致一些地方在数据共享、开放与共通上仍存在较大的障碍,“数据孤岛”现象普遍存在。在依法加强安全保障和隐私保护的前提下,应当合理推动政府部门之间数据共享和业务协同,以资源目录汇编、资源整合汇聚、交换共享平台等手段,坚持“一数一源”、多元校核,统筹建设政务信息资源目录体系和共享交换体系,提高行政效能、服务质量和管理水平。通过市场机制解决企业间、行业间、政府间的“数据孤岛”问题,并全面开发“野生数据”资源的巨大价值,实现大数据的普惠服务。

三、搭建数据信用体系

隐私保护越来越受到人们的重视,“互联网+电子商务”、“互联网+医疗健康”、“互联网+智能家居”、“互联网+出行服务”都是个人信息保护的重点区域。个人信息是大数据时代重要的数据资产,但它同时也承载着个人用户的人格利益和财产利益。数字经济趋势下,个人信息应用场景广泛延展至社会管理和商业领域,在创造价值的同时也要避免对其滥用从而损害个人权益。

但数据的开放共享是人工智能和数字经济发展的命脉之所在,也是中国在下一轮国家间新技术竞争取胜的关键之所在。如何在数据隐私的必要保护与开放共享之间保持平衡,最大限度发挥数据要素的潜在价值,就是推动数据要素市场化配置的重大挑战。而法律法规滞后,治理体系落后也掣肘着数字经济的发展,特别是在数据产权方面,相关主体责权边界不清,难以得到法律保护。

公正构建数据权利义务规则。通过法律机制填补普通民众和平台之间的科技鸿沟,维护公民个人信息相关权利,同时,应当在合理公正的基础上构建企业的数据权利义务体系。鉴于数据价值难以评估、转让的法律规范不甚明确,并且逐一谈判会大幅提高交易费用,因此,相关交易并不活跃,这也是导致数据封锁相对容易的原因。可以通过必要的干预,事先确立公允价值允许按照责任规则获得数据和分享数据价值,这有助于数据自由流转,建构公正的数据利益分享机制。在保证企业经济利益的同时,可以要求其承担更大的个人信息保护和数据安全义务。通过科技维度的补强,国家可以通过区块链等手段实时监控数据利用情况,保证企业数据使用实时记录、不可篡改,从而加强在数据利用中企业的保护责任并强化问责机制。

四、数据确权,构建数据权力体系

完善数据确权机制。以个人数据可携带权撬动企业之间数据流动,促进数据利益分享。个人对其数据的可携带权,不仅有利于个人在其他企业处获得个性化定制服务,同时也能够促进数据共享,推动企业间竞争。数据可携带权的实现需要付出一定成本确立通用的数据传输格式,如果一刀切地在整个行业实行,对于规模较小的企业而言合规成本较高,可能仍然导致其处于竞争劣势地位。因此应当事先调研相关行业的市场集中度情况,依此推行数据可携带原则,促进企业向个人分享数据收益。在技术维度中,通过区块链等技术及理念范式,以科技共识和科技信任承载数据确权需求。目前,区块链线下权益、线上确权和交易已有实践范例。今后可以探索将数据的相关权属和权益标记在区块链上,便利数据利益分享与交易。

建立健全数据权利体系,根据数据性质逐步分类确权赋权。对于有主体信息的数据,明确该主体的所有权,完善个人信息授权制度,允许授权使用;对于主体信息不明、采用脱敏技术处理或深入分析挖掘的数据,明确数据开发主体的所有权,赋予企业这些数据信息的自主使用、共享、开放和交易,要求企业采取措施防止脱敏后的数据追溯到用户或者被复原。

五、严格控制数据中心的节能减排

我国数据中心的能耗占比高于全球的平均水平,我国乃至全球数据中心的节能减排和降低运营成本面临巨大挑战。伴随“算力”的提高,数据中心的运行能耗及其运行成本也将面临不断攀升的可能。

将数据中心能源系统的规划,提前纳入所在园区基础设施一体化建设规划或城市建设及供暖规划,做好数据中心综合能源系统的顶层设计,统一施策。作为能源消费者,数据中心节能降耗的首要任务就是负荷侧能耗的降低。具体措施包括采用更节能的机架、服务器及运行策略、配电系统和空调系统的优化,甚至自然或免费冷源的使用等。构建融合数据中心的综合能源系统。全球来看,现有以可再生能源给数据中心供电的方式,包括自建可再生能源发电项目、直接向发电企业采购绿电、采购绿色电力证书以及电力现货市场化交易等方式。

随着风电、光电、水电等可再生能源发电技术的成熟以及成本的下降,传输通道和功率预测调控技术的不断发展,以及我国电力市场化交易机制的不断完善,可再生能源向数据中心供应能源的技术路线将不断成熟。数据中心作为能耗大户,在可再生能源使用上有着主动和被动的驱动力。应结合当地资源禀赋及负荷特性,合理构建数据中心的多能互补综合能源系统,促进可再生能源的大规模利用,进而实现数据中心供能的高效化、低成本和清洁化。

另一方面,作为能源生产者,数据中心也可以供能。实际上,数据中心的微处理器、存储器、逆变器、主板、风扇的散热温度,在85℃—30℃之间,而且高性能数据中心的散热强度甚至可高达10000W/m2,即数据中心的散热余热,可占到数据中心总耗电的40%以上。因此,热工视角下,如果这些余热得以有效利用,这无疑是一个巨大的中低品位热源。

近年来,随着压缩式热泵、高效换热(肋片换热器、热管)、相变蓄能与水蓄能等中低品位热能高效回收与利用技术的发展,使数据中心的余热回收成为可能。比如北欧一些国家,已经应用热泵技术回收数据中心大量的低品位热源余热,用于周边建筑的采暖、生活热水或游泳池水温的加热,如此,节省建筑采暖费用的同时,还能够降低数据中心散热能耗。再如,按现有数据中心规模,我国北方地区数据中心的可回收余热总量约有10GW,这意味着,不需要再消费另外能源,便可实现3亿2左右建筑的供暖,并实现二氧化碳减排约1000万吨。

六、大力促进行业应用推动大数据中心基础设施建设

通过大力发展相关行业,可以扩大全社会对大数据中心的需求,有效提高大数据中心的利用率。AI、5G、区块链等场景化应用,为数据中心发展打开新的成长空间。在国家政策和资本的共同推动下,AI生态不断完善,AI场景化应用加速落地,AI基础设施服务服务将迎来快速发展新时期。5G商用在即,大量基于5G的应用在金融、制造、医疗、零售等传统行业中开始示范与推广,VR/AR、自动驾驶、高清视频、智能交通、智能医疗等应用需求也将为数据中心市场发展与服务模式创新打开成长空间。2019年底,政府首次将区块链技术发展列为国家战略重点方向,未来,区块链技术在应用场景上将从当前的跨境交易、商品溯源、金融创新、供应链整合等经济领域,延伸到民生需求、城市治理和政务服务等社会政策和公共服务领域,必然带来大量分布式计算、分布式存储、分布式数据库管理需求。

七、大力培养数字型创新人才

目前大数据建设不仅缺乏IT工程师、数据科学家、数据分析师、AI算法工程师、产品经理等传统技术精英,更缺乏跨行业、跨平台的复合型人才。

大力培育数字化创新人才,加强对全体公民的数字技能普及培训,提升全民数字化素质。加快推进面向数字经济的学科建设,发展数字领域新兴专业,促进计算机科学、数据分析与其他专业学科间的交叉融合,扩大互联网、物联网、大数据、云计算、人工智能等数字人才培养规模。

附录1大数据成全国两会热点

全国人大代表杨帆:加快建立全国一体化的数据“聚通用”体制机制,统筹推进全国各级各部门的数据共享开放、融合应用、流通交易、新型智慧城市建设等工作

全国人大代表杨剑宇:搭建大数据共享平台满足各领域需求,政府加强大数据的安全保障,进一步完善法律法规,确保大数据在数据归集、存储、应用等各个环节的安全可靠运行。

全国人大代表陈建华:当前金融大数据搜集、整理与应用能力已成为主权大国之间开展金融竞争的主要依托力量,金融大数据治理也已成为全球金融治理的重要内容并成为推动全球金融治理机制变革和演化的重要推动力量。建议构建雄安新区金融大数据中心。

全国人大代表孙丕恕:加快开展系统的健康医疗大数据产业发展的法律法规和政策体系建设,在确保数据安全和隐私保护前提下,完善健康医疗大数据授权运营机制,加快健康医疗大数据在药械企业、保险行业的应用和发展,营造“以数引智、以数育商”的产业发展氛围。

全国人大代表魏明:建议加快制定“数据安全法”,确立数据主权、明确数据安全法的管辖范围,对数据经营进行牌照化管理,建立数据采集、加工和利用业务的准入制度,完善数据安全监管体系和数据安全监测预警、应急处置机制,建立责任主体问责制度等。

全国人大代表俞光耀:建议以《促进大数据发展行动纲要》《大数据产业发展规划(2016—2020年)》等国家指导性文件、地方性法规为基础,从国家层面加快研究建立覆盖数据采集、整理、应用和隐私保护等全流程的数据质量监管法制体系。

全国人大代表张爱军:建议中央相关部委抓紧运用大数据、信息化等手段助力产业特别是中小微企业发展。

全国人大代表檀结庆:扩大国产数据库金融领域试点,设立数据库产业引导基金,搭建前沿技术信息共享平台。

全国人大代表石蓉:制定相关法律,完善规范体系,彻底解决部门之间、行业之间大数据共享障碍问题。

全国政协委员王均金:利用大数据技术,构建信息实名、数据完备的全国性农民工信息大数据平台。

全国政协委员徐晓兰:加大工业互联网大数据中心投资,强化数据共享,构建完善的工业互联网数据合作共享机制;强化工业互联网数据合作共享生态;加大对工业互联网大数据中心建设的投资力度。(https://www.xing528.com)

全国政协委员童国华:建设国家大数据中心;持续完善数字政府建设,夯实数字化支撑能力;以构建公共应急体系为切入点,释放大数据价值;解决困扰大数据运用难题,共同营造信息充分可控、安全运行的绿色生态。

附录2工信部2020年大数据产业发展试点示范项目公示名单

续表

续表

续表

续表

续表

续表

续表

续表

续表

续表

续表

续表

续表

参考文献:

[1]通信世界,工信部:加快打造大数据工业应用发展新生态。

[2]中国大数据产业观察网,搜狐,大数据成全国两会热点10余位代表委员提交相关建议。

[3]第一财经,我国ICT产业局部领跑,人才缺口超700万。

[4]大数据产业生态联盟,2019中国大数据产业发展白皮书。

[5]中国信息通信研究院,大数据白皮书(2019)。

[6]中国信息通信研究院,2019云计算发展白皮书。

[7]民生证券,2019年数据中心IDC行业深度研究报告

[8]中国江苏网,南京:到2022年云计算和大数据产业规模达千亿级。

[9]新华网,建好用好大数据中心。

[10]工信部,关于工业大数据发展的指导意见。

[11]工信部联节2019年第24号,《关于加强绿色数据中心建设的指导意见》。

[12]集成电路应用,张瑾,国产芯片的自主可控与自主创新之路任重道远。

[13]国际在线,以大数据、人工智能等数字技术为支撑新产业新业态增长可期。

[14]腾讯云,“新基建”背景下的大数据中心的规划建设新挑战!

[15]能源杂志,清华大学能源互联网创新研究院,王永真赵伟张靖,能源互联网下的数据中心能源供应。

[16]思科,思科云产业调研报告(2016—2021)。

[17]赛迪网—中国电子报,闵杰,数据中心能效标准成云标准热点。

[18]学习时报,杨东,完善数据作为生产要素的利益分享机制。

[19]中国特色社会主义研究,单勇,跨越“数字鸿沟”:技术治理的非均衡性社会参与应对。

[20]电子产品世界,解码新基建“数据中心”:半导体产业发展新支点。

[21]澎湃新闻,赛迪顾问谈新基建|大数据中心将成为国家竞争力新内涵。

[22]新浪财经,边缘计算:万亿蓝海市场加速爆发。

[23]中国IDC圈,数据中心或许会成为未来5G最强大的技术支撑。

[24]第一财经日报,李娜,美国为什么要向中国出口新规定“卡”?

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈