首页 理论教育 BigTable:云计算中的核心技术

BigTable:云计算中的核心技术

时间:2023-10-29 理论教育 版权反馈
【摘要】:它们使用的BigTable集群的配置也有很大的差异,有的集群只有几台服务器,有的则需要上千台服务器、存储几百TB的数据。BigTable不支持完整的关系数据模型,而为客户提供简单的数据模型。BigTable将存储的数据作为字符串,但不解析字符串,用户程序通常会把各种结构化或半结构化的数据串行化到这些字符串里。用户可以通过仔细选择数据的模式控制数据的位置相关性,也可以通过BigTable的模式参数来控制数据的存放位置。

BigTable:云计算中的核心技术

BigTable是非关系型数据库,是一个稀疏的、分布式的、持久化存储的多维度排序Map,可以快速且可靠地处理PB级别的数据,并且能够部署到上千台机器上。

BigTable已经在超过60个Google的产品和项目上得到了应用,包括Google Analytics、Google Finance、Orkut、Personalized Search、Writely和Google Earth,这些产品对BigTable提出了不同的需求,有的需要高吞吐量批处理,有的需要及时提供响应数据给最终用户。它们使用的BigTable集群的配置也有很大的差异,有的集群只有几台服务器,有的则需要上千台服务器、存储几百TB的数据。

并行数据库和内存数据库具备可扩展性和高性能,BigTable提供了一个和这些系统完全不同的接口

BigTable不支持完整的关系数据模型,而为客户提供简单的数据模型。BigTable而言,数据是没有格式的,用户可以利用BigTable提供的模型,动态控制数据的分布和格式,也可以推测底层存储数据的位置相关性[1]。数据的下标是行和列的名称,名称可以是任意的字符串。

BigTable将存储的数据作为字符串,但不解析字符串,用户程序通常会把各种结构化或半结构化的数据串行化到这些字符串里。用户可以通过仔细选择数据的模式控制数据的位置相关性,也可以通过BigTable的模式参数来控制数据的存放位置。

BigTable的特点如下:

(1)适合大规模海量数据,如PB级数据;(www.xing528.com)

(2)分布式、并发数据处理效率极高;

(3)易于扩展,支持动态伸缩;

(4)适用于廉价设备;

(5)适合进行读操作,不适合进行写操作;

(6)不适用于传统的关系型数据库。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈