HBase 官方文档 Copyright © 2010 Apache Software Foundation, 盛大游戏-数据仓库团队-颜开(译) Revision History Revision 0.90.4 配置,数据模型使用入门 Abstract 这是 Apache HBase的官方文档, Hbase是一个分布式,版本化(versioned),构建在 Apache Hadoop和 Apache ZooKeeper上的列数据库. 我(译者)熟悉Hbase的源代码,从事Hbase的开发运维工作,如果有什么地方不清楚,欢迎一起讨论。邮箱 yankaycom@gmail.com Table of Contents 序 1. 入门 1.1. 介绍 1.2. 快速开始 1.2.1. 下载解压最新版本 1.2.2. 启动 HBase 1.2.3. Shell 练习 1.2.4. 停止 HBase 1.2.5. 下一步该做什么 1.3. 慢速开始(相对快速开始) 1.3.1. 需要的软件 1.3.2. HBase运行模式:单机和分布式 1.3.3. 配置例子 2. 升级 2.1. 从HBase 0.20.x or 0.89.x 升级到 HBase 0.90.x 3. 配置 3.1. hbase-site.xml 和 hbase-default.xml 3.1.1. HBase 默认配置 3.2. hbase-env.sh 3.3. log4j.properties 3.4. 重要的配置 3.5. 必须的配置 3.6. 推荐的配置 3.6.1. zookeeper.session.timeout 3.6.2. hbase.regionserver.handler.count 3.6.3. 大内存机器的配置 3.6.4. LZO 压缩 3.6.5. 更大的 Regions 3.6.6. 管理 Splitting 3.7. 连接Hbase集群的客户端配置和依赖 3.7.1. Java客户端配置 4. The HBase Shell 4.1. 使用脚本 4.2. Shell 技巧 4.2.1. irbrc 4.2.2. LOG 时间转换 4.2.3. Debug 5. 构建 HBase 5.1. 将一个 HBase release 加入到 Apache's Maven Repository 6. Developers 6.1. IDEs 6.1.1. Eclipse 6.2. 单元测试 6.2.1. Mocito 7. HBase 和 MapReduce 7.1. 默认 HBase MapReduce 分割器(Splitter) 7.2. HBase Input MapReduce 例子 7.3. 在一个 MapReduce Job中访问其他的HBase Tables 7.4. 预测执行 8. HBase 的 Schema 设计 8.1. Schema 创建 8.2. column families的数量 8.3. 单调递增 Row Keys/时序数据(log) 8.4. 尽量最小化 row和column的大小 8.5. 版本的时间 9. Metrics 9.1. Metric 安装 9.2. RegionServer Metrics 9.2.1. hbase.regionserver.blockCacheCount 9.2.2. hbase.regionserver.blockCacheFree 9.2.3. hbase.regionserver.blockCacheHitRati...