写在前面的几点肺腑:知识的积累和总结不单单是脑力的训练,更是需要付出极大的毅力和勇气,所以请整理心情,保持一份尊重,出于对知识的尊重。实践永远是最好的老师。海空天空的想,脚踏实地的做,加上持之以恒。一定一定会有所收获。设计一套解决方案,决不要仅局限在技术实现的层面。要求理解,费用控制,日程把握,资源调配,数据安全,备份恢复,错误监视,运用手顺,维护支持。全方位的思考才能被全方面的接受。(最后的附录中会以一个实例纪录一个解决方案的诞生的整个过程,以及这之间发生的一系列问题,请一定要阅读)永葆好奇心,永葆探求的精神。目次数据处理-所谓何.................................................................................5数据生命周期..............................................................................................5ETL工具所谓何.......................................................................................14DataCleansing与DataQuality......................................................18TalendDI安装和初期设定..............................................................20安装准备...................................................................................................20下载TOS-DI..................................................................................21启动TalendStudio........................................................................21配置TalendStudio(externalmodules)............................................23备份和恢复TOS-DI........................................................................24TOS-DIGUI....................................................................................25偏好设定(Preference)........................................................................29设计Business模型.........................................................................34Business模型是什么...............................................................................35尝试建模...................................................................................................36设计Job和数据处理.......................................................................42从一个简单Job说起..............................................................................42详说组件间的连接(Connection)........................................................53活用MetaData...............................................................................59Job的执行..............................................................................................102Job/Item的导入导出.............................................................................107Project&Job设定.................................................................................111Stats&Log管理..................................................................................113Context管理..........................................................................................115Status设定和管理................................................................................116版本管理.................................................................................................119生成文档.................................................................................................121Job高级选项..........................................................................................121其他设定...........................................................................