电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

ETL工具研究报告VIP免费

ETL工具研究报告_第1页
1/22
ETL工具研究报告_第2页
2/22
ETL工具研究报告_第3页
3/22
ETL研究报告1.TalendOpenStudioforBigData是一款开源的数据集成软件包,用户能够使用该产品将数据在Hadoop集群以及企业内部系统(如关系型数据库或数据仓库)之间进行移动。该平台还允许用户创建相关技术的连接器,比如HBase、Pig、Sqoop和Hive等。TalendOpenStudioforBigData还提供了针对各种数据库的连接器。适用的DB类型:输入(能读取)的文件类型:.csv,.arff,.txt,.ldif,.mail,.xml,.properties。效率:Oracle->Oracle间两千万条数据转移需要6个小时,Oracle->SQLServer间两千万条数据转移需要11个小时Oracle->Oracle转换工具图:Oracle->SQLServer转换工具图:Oracle->SQLServer转移的时候TalendOpenStudioforBigData工具所在电脑性能:Oracle->SQLServer转移的时候SQLServer所在电脑性能:Oracle->SQLServer转移的时候Oracle所在电脑性能(服务器):按照以上图看不会影响导入数据的效率。2.Kettle:适用的DB类型:输入(能读取)的文件类型:效率:Oracle->Oracle间两千万条数据转移需要8个小时,Oracle->SQLServer间两千万条数据转移需要12个小时费用问题:Kettle是免费的。TalendOpenStudioforBigData分免费版和商业版,商业版是多线程操作,效率快,免费版相对慢,根据talend公司提供的数据,商业版的2000万条数据是36分钟,但是免费版的要用一个多小时。3.DataStage,这是IBM为其配套的DB2开发的ETL工具,也可以用于其它数据库数据的集成。最专业的ETL工具,价格不菲,使用难度一般。我们上网查了两天,网上提供的资源都不好用,装了好几个都没法打开,所以也没有办法看用这个工具转移两千万条数据所用的时间。从而没办法比较时间。4.SQLServerIntegrationServices:适用的DB类型:SqlServer,Oracle,DB2,Access,。输入(能读取)的文件类型:Excel,xml,原始文件(是SSIS独有发文件存储机制,只能由DataaFlowDestination创建)效率:SQLServer>SQLServer间两千万条数据插入需要8分钟53秒,SQLServer>SQLServer间两千万条数据插入更新需要1小时43分钟,Oracle->SQLServer间两千万条数据转移需要14分钟29秒。SQLServer>SQLServer两千万条数据插入:SQLServer>SQLServer两千万条数据插入更新:Oracle->SQLServer间两千万条数据插入:SQLServerIntergrationServices优点速度快,缺点是类型转换存在问题,如果要用的话还需要仔细配置。支持的数据库类型不多。我说一下用SSIS的感受,一开始测试的时候很快,当时感觉真是个不错的ETI工具,但是后来连接oracle数据库时配置很麻烦,出很多问题也花费了大量的时间,好不容易才导成功了。如果不同库之间进行导入导出的时候要有数据类型转化会容易出问题。所以为了导入数据更方便效率,不建议用SQLServerIntergrationServices。总结:经过这些天的研究测试,我认为如果要进行数据转移可以这样分配:当数据是在sqlserver库之间转化时用SQLServerIntergrationServices。而其他库之间的转化时用TalendOpenStudioforBigData。kettle不是很稳定,所以不建议用这个。

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

ETL工具研究报告

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部