Hbase的入门心得:

Hbase的入门心得

在了解了Hadoop的大家族的核心成员HDFS,MapReduce以及资源管理器YARN后,HBase又是一个新颖的技术出现。在超人学院吴超老师的视频里介绍到,HBase-Hadoop Database是一个分布式的、面向列的开源数据库。那么什么是面向猎德数据库呢?相对于列,原来传统的数据库是面向行的,基本数据库知识中就会介绍到,创建一个Table时候先定义好字段名和该字段的长度。即在机器中,一行的长度是已经没确定定义好的。而面向列的存储则不一样,是将可以将两列即,两个字段的内容放在一个机器A里,将3列,3个字段的内容放在机器B里。在一个大宽表中,字段非常多。但是用户可能的需求只是查询其中4-5个字段对应的内容,当时传统的数据库实际上是把大宽表相关的行都找出来,然后用户其实是对那个这些个数据进行显示的过滤。实则在本质在机器中已经做了很多不必要的检索和I/O读取就是将那些用户不看重的字段也都检索出来了。只是用户选择性过滤掉了。这样的性能很慢。所以,在面向列存储之后。客户能够更快的从A机器的一列中和B机器的一列中找出自己需要的数据,大大减少了从原来检索不必要字段的时间。所以如视频中提到的HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PCServer上搭建起大规模结构存储集群。

你可能感兴趣的:(Hbase的入门心得:)