Data*3
0 使用手册目录一、data 概述 2ldata 作用 22Data*3
0 框架设计 23Data*3
0 插件体系 2二、data*安装 41 创立用户组及用户 42 环境变量配置 43 安装 python4三、data*使用 51 生成配置文件模板 52 配置定时任务 83 常见问题及处理 8四、data 插件开发及安装 81
Reader 插件开发 82
Writtefe 件开发 93
插件部署 10data 概述1 data 作用Data*是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle 等)
HDFS、Hive ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能
为了解决异构数据源同步问题,Data*将复杂的网状的同步链路变成了星型数据链路,Data*作为中间传输载体负责连接各种数据源
当需要接入一个新的数据源的时候,只需要将此数据源对接到 Data*,便能跟已有的数据源做到无缝数据同步
2 Data*3
0 框架设计Data*本身作为离线数据同步框架,采纳 Framework + plug 架构构建
将数据源读取和写入抽象成为 Reader/Write 插件,纳入到整个同步框架中
Reader: Reader 为数据采集模块,负责采集数据源的数据,将数据发送给 Framework
Writer Writer^数据写入模块,负责不断向 Framework 取数据,并将数据写入到目的端
Framework: Framework 用于连接 reader 和 writer 作为两者的数据传输通道,并处理缓冲,流控,并发,数据转换等核心技术问题
3 Data*3
0 插件体系类型数据源Reader 读)Writer 写)RDBMS 关系型数据库MySQLA//OracleA//SQL Ser