Hbase列式存储VIP免费

下载本文档

阅读 105
下载 9
格式 pptx
大小 2.19 MB
约17页
2024-10-18 发布于江苏
收藏
评论
点赞(0)
海报
举报

1/17页

2/17页

3/17页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/17

文本预览下载提示常见问题

Hbase列式存储HBASECOLUMNARSTORAGE目录行式存储列式存储行列对比HBase1行式存储行式存储传统的数据库是关系型的，且是按行来存储的。如下图点击此处添加标题其中只有张三把一行数据填满了，李四王五赵六的行都没有填满行式存储因为这里的行结构是固定的，每一行都一样，即使你不用，也必须空着在那里，而不能没有。来张形象的图：不管你坐或不坐，座位都在那里，不离不弃。2列式存储列式存储初次看列式存储稍微有点懵，下面给出行存与列存的转换：原来张三的一列（单元格）数据对应现在张三的一行数据。原来张三的六列数据变成了现在的六行。原来的六列数据是在一行，所以共用一个主键（即张三）。现在变成了六行，每行都需要一个主键（不然不知道这行数据是谁的），所以原来的主键（即张三）重复了六次。为了与传统的区别，新型数据库叫做非关系型数据库，是按列来存储的。如图：列式存储如图：列式存储由于原来的列变为了现在的行，如果有需要就加一行，没需要就不加，不会造成空间浪费。来一张形象的图：摆渡车内部就是一个大平板，你要站便站，我给你空间，你不站便不站，还给我空间。3行列对比行列对比01030402行式存储一行数据只需一份主键，列式存储一行数据需要多份主键。行式存储倾向于结构固定，列式存储倾向于结构弱化。（行式存储相当于套餐，即使一个人来了也给你上八菜一汤，造成浪费；列式存储相等于自助餐，按需自取，人少了也不浪费）行式存储更像一个JavaBean，所有字段都提前定义好，且不能改变；列式存储更像一个Map，不提前定义，随意往里添加key/value行式存储存的都是业务数据，列式存储除了业务数据外，还要存储列名。4HBaseHBase有了前面的介绍，我们可以进入HBase了。HBase的目标是管理超级大表-数十亿行*数百万列。Hbase是一个开源的、分布式的、带版本的、非关系型数据库，模仿谷歌的BigTable。BigTable使用GoogleFileSystem作为分布式数据存储，同理Hbase使用HDFS。Hbase虽然弱化了结构，但并不等于放任不管。传统关系型数据库在插入数据前表结构（即所有列和列的数据类型）已经是严格确定的。Hbase的表在放入数据前也有需要确定下来的东西，那就是ColumnFamily（常译为列族/列簇）。单词Family就是家庭的意思，所以列族就是列的家庭。那么列自然就是家庭成员了，通常家庭成员都有多个，所以一个列族包含多个列。一个家庭的成员之间具有血缘关系，所以一个列族的多个列之间通常也具有某种关系，比如相似或同种类别。所以列族可以看作是某种分类（归类）。一个非常常见的例子，去面试的时候，一般前台MM都会让填一张表，通常信息很多，每个公司又不尽相同。但大致可以分三类：人员基本信息，教育经历信息，工作经历信息，这三个类别其实就相当于三个列族。如图：HBase在Hbase中一个列族（ColumnFamily）和一个列修饰符（ColumnQualifier）组合起来才叫一个列（Column），使用冒号（:）分割，列族:列修饰符，如下图：每个类别里都会有具体的信息，比如人员基本信息里有姓名、电话、出生年月等，它们就相当于一个个标识符（变量名），在Hbase中叫做ColumnQualifier（列修饰符）。列修饰符位于列族里面用来标识一条条数据。如右图：在传统数据库中每一行的唯一标识符叫做主键，在Hbase中叫做rowkey（行键）。如下图：HBase数据在进入Hbase时都会被打上一个时间戳，这个时间戳可以作为版本号来使用。在t1时间我存入一个人的基本信息，之后发现姓名错了，在t2时间又更新了姓名，此时并不会去更新原来的那条数据，而是又插入了一条新数据且打上新的时间戳。此时去查询获取的是新数据，仿佛是更新了，但其实只是默认返回了最新版本的数据而已。如右图：一个行键、列族、列修饰符、数据和时间戳组合起来叫做一个单元格（Cell）。这里的行键、列族、列修饰符和时间戳其实可以看作是定位属性（类似坐标），最终确定了一个数据。下图中的一行相等于Hbase中的一个单元格：HBase一个行键、一到多列（包括数据）组合起来叫做一行（Row）。下图中所有1001的数据合起来相当于Hbase中的一行，1002的相当于另一行，如右图在Hbase中，只要确定了列族（具体的列不用管），...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

Hbase列式存储

Hbase列式存储HBASECOLUMNARSTORAGE目录行式存储列式存储行列对比HBase1行式存储行式存储传统的数据库是关系型的，且是按行来存储的

如下图点击此处添加标题其中只有张三把一行数据填满了，李四王五赵六的行都没有填满行式存储因为这里的行结构是固定的，每一行都一样，即使你不用，也必须空着在那里，而不能没有

来张形象的图：不管你坐或不坐，座位都在那里，不离不弃

2列式存储列式存储初次看列式存储稍微有点懵，下面给出行存与列存的转换：原来张三的一列（单元格）数据对应现在张三的一行数据

原来张三的六列数据变成了现在的六行

原来的六列数据是在一行，所以共用一个主键（即张三）

现在变成了六行，每行都需要一个主键（不然不知道这行数据是谁的），所以原来的主键（即张三）重复了六次

为了与传统的区别，新型数据库叫做非关系型数据库，是按列来存储的

如图：列式存储如图：列式存储由于原来的列变为了现在的行，如果有需要就加一行，没需要就不加，不会造成空间浪费

来一张形象的图：摆渡车内部就是一个大平板，你要站便站，我给你空间，你不站便不站，还给我空间

3行列对比行列对比01030402行式存储一行数据只需一份主键，列式存储一行数据需要多份主键

行式存储倾向于结构固定，列式存储倾向于结构弱化

（行式存储相当于套餐，即使一个人来了也给你上八菜一汤，造成浪费；列式存储相等于自助餐，按需自取，人少了也不浪费）行式存储更像一个JavaBean，所有字段都提前定义好，且不能改变；列式存储更像一个Map，不提前定义，随意往里添加key/value行式存储存的都是业务数据，列式存储除了业务数据外，还要存储列名

4HBaseHBase有了前面的介绍，我们可以进入HBase了

HBase的目标是管理超级大表-数十亿行*数百万列

Hbase是一个开源的、分布式的、带版本的、非关系型数据库，模仿谷歌的BigTa

您可能关注的文档

读万卷书 + 关注: 实名认证
内容提供者

各类经典PPT文档分享

收藏店铺进入空间

Hbase列式存储VIP免费

Hbase列式存储

您可能关注的文档

相关文档

热门下载

相关标签