《大数据技术及应用》信息科学与技术学院1石家庄铁道大学信息科学与技术学院第四章分布式数据库HBase大数据技术及应用《大数据技术及应用》信息科学与技术学院2提纲4
2HBase访问接口4
3HBase数据模型4
4HBase的实现原理4
5HBase运行机制4
6HBase应用方案4
7HBase编程实践《大数据技术及应用》信息科学与技术学院34
1从BigTable说起•4
2HBase简介•4
3HBase与传统关系数据库的对比分析《大数据技术及应用》信息科学与技术学院44
1从BigTable说起主流解决方案厂商的发展策略及现状《大数据技术及应用》信息科学与技术学院5主流解决方案——Google云计算•数据存储在“云”中•数据访问不受地理位置限制•数据能够很方便的共享《大数据技术及应用》信息科学与技术学院6Google云计算技术具体包括:•Google文件系统海量数据分布存储技术(GFS)、•分布式计算编程模型MapReduce、•分布式锁服务Chubby•分布式结构化数据存储系统Bigtable等
主流解决方案——Google云计算《大数据技术及应用》信息科学与技术学院7•Google需要一个支持海量存储的文件系统–购置昂贵的分布式文件系统与硬件
Google设计GFS的动机是否可以在一堆廉价且不可靠的硬件上构建可靠的分布式文件系统
是否可以在一堆廉价且不可靠的硬件上构建可靠的分布式文件系统
7《大数据技术及应用》信息科学与技术学院8•为什么不使用当时现存的文件系统
–Google所面临的问题与众不同•不同的工作负载,不同的设计优先级(廉价、不可靠的硬件)–需要设计与Google应用和负载相符的文件系统Google设计GFS的动机8一个适用于大规模分布式数据处理相关应用的,可扩展的分布式文件系统
它基于普通的不算昂贵的硬件设备,