大规模分布式存储(1)-- 概念、挑战和分类

随着数据的激增,我们已经进入到了一个数据时代,无论是云计算,大数据还是互联网公司的各种应用,其后台存储平台的目标都是要构建低成本、高性能、可扩展、易用的分布式存储系统。

相比传统的分布式存储系统,互联网公司的分布式存储系统具有两个特点:规模大和成本低。

本文主要介绍一下什么是大规模分布式存储系统,以及分布式存储系统有哪些类别。

一、分布式存储的概念

1.1 大规模分布式存储系统的定义

大规模分布式存储系统的定义:大量普通的PC服务器通过Internet互联,对外作为一个整体提供存储服务。

1.2 分布式存储系统特性

分布式存储系统具有如下几个特性:

  • 可扩展:分布式存储系统可以扩展到成千上万台的集群规模,且随着集群规模的增长,系统整体性能表现为线性增长;

  • 低成本:分布式存储系统会提供自动容错、自动负载均衡等机制使其可以构建在廉价的PC机之上。

  • 高性能:无论是针对整个集群还是单台服务器,都要求分布式存储系统具备高性能;

  • 易用:分布式存储系统需要能够提供易用的对外接口,另外,也要求具备完善的监控、运维工具,并能够方

你可能感兴趣的:(HDFS全方位实战,分布式,分类,数据库)