ETL研究报告1
TalendOpenStudioforBigData是一款开源的数据集成软件包,用户能够使用该产品将数据在Hadoop集群以及企业内部系统(如关系型数据库或数据仓库)之间进行移动
该平台还允许用户创建相关技术的连接器,比如HBase、Pig、Sqoop和Hive等
TalendOpenStudioforBigData还提供了针对各种数据库的连接器
适用的DB类型:输入(能读取)的文件类型:
properties
效率:Oracle->Oracle间两千万条数据转移需要6个小时,Oracle->SQLServer间两千万条数据转移需要11个小时Oracle->Oracle转换工具图:Oracle->SQLServer转换工具图:Oracle->SQLServer转移的时候TalendOpenStudioforBigData工具所在电脑性能:Oracle->SQLServer转移的时候SQLServer所在电脑性能:Oracle->SQLServer转移的时候Oracle所在电脑性能(服务器):按照以上图看不会影响导入数据的效率
Kettle:适用的DB类型:输入(能读取)的文件类型:效率:Oracle->Oracle间两千万条数据转移需要8个小时,Oracle->SQLServer间两千万条数据转移需要12个小时费用问题:Kettle是免费的
TalendOpenStudioforBigData分免费版和商业版,商业版是多线程操作,效率快,免费版相对慢,根据talend公司提供的数据,商业版的2000万条数据是36分钟,但是免费版的要用一个多小时
DataStage,这是IBM为其配套的DB2开发的ETL工具,也可以用于其它数据库数据的集成
最专业的ETL工具,价格不菲,使用难度一般