日志和文件接入规范数据接入规范-日志和文件修订历史日期修改说明部门修改人数据接入需求基于数据采集需求,初步判断数据的接入源是否可以从日志和文件进行获取
联系技术研发部同事,请求数据源接入的位置参数,通过配置化方式定期读取服务器指定位置的日志和文件,通过程序清洗日志,分割成字段装载到数据仓库贴源层
数据接入流程1
数据中心分析组接到TAPD数据接入需求之后,分析接入数据属于数据接口列表的哪个系统,在对应的系统标题下添加模板,参照APP-app_login_log
和需求发起人进行沟通,确定提供数据的方式(数据库、文件、接口等),让需求发起人补充详细的数据口径,补充到需求要求里面,指定数据仓库组或平台组的一个人进行转发
数据仓库组或平台组根据需求描述
跟数据源提供方(可以是需求发起方、也可以是技术研发部门)沟通,让其补充模板里的位置参数
数据源提供方根据模板要求,提供位置配置参数
数据仓库组或平台组在接入数据后,整理数据格式,编写日志清洗转换脚本,并补充装载目标表信息
数据中心分析组对最终接入的数据进行验收,并通知需求发起人如何获得接入数据
数据源接入模板需求要求(分析组补充)tapd需求单号:1002513提起人:xxx(Richard
chen)需求单号内容:
提供数据方式:数据库、文件、接口详细的数据口径:
位置配置参数(技术研发部补充)配置参数参数取值服务器地址192
1端口类型ftp端口号22系统用户名user密码pwd日志路径日志文件通配符xxx/yyyymmdd/AppLogapp_login_log_[yyyymmdd]
json日志内容分割规则文字描述接入模型字段(仓库组补充)字段名注释字段类型此资料由网络收集而来,如有侵权请告知上传者立即删除
资料共分享,我们负责传递知识
必填必填必填必填必填必填抽取参数(仓库组补充)配置