电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

20XX数据分析工作总结

20XX数据分析工作总结_第1页
20XX数据分析工作总结_第2页
20XX数据分析工作总结_第3页
20XX 数据分析工作总结 在这一段时间的工作中,遭遇到了很多的问题,也尝试了多种解决方案,最后获得良好的效果,这也离不开同事的帮助,从中可以感悟到自身的不足,需要在以后的时间中加强自我的能力。下面是我带来的 20XX 数据分析工作总结。 近期主要完成了某产品用户画像分析,从 9 月底拿到数据,到上周输出第三稿,中间历时一个半月,假如从收到需求,到三稿输出,那就超过两个月,在这次整个分析过程中,遇到了不少问题,尝试了使用不同方法,现在是时候做一个复盘、总结、反思。 在开始阶段,遇到的主要问题是客户的要求是分析产品用户画像报告,因为没有直接跟客户沟通,而需求只有简单的一句话,我只能根据经验列出要分析的要点,确定需要的数据维度。在我确定分析框架后,我发现假如根据我方的想法最后输出的结果却不是客户想到的,那就白做了,所以确定分析框架后还需要客户确认,思路是否可行,分析方向有无异议。这个问题还算比较好解决,客户同意了分析思路即可。 经过与客户沟通后,到了第二阶段,发起提数需求。这个过程总体算比较顺利,客户方数据库工程师首先反馈了一份样本数据,让我方确认数据是否正确,如正确,则提供全量样本。数据验证的过程,主要是由我来完成,对样本数据,我提出了一些疑问,对方也一一解答。当然还有个别字段逻辑问题,我没有发现,对后续的分析带来了一些影响,造成最后能使用的维度减少,是一个遗憾。 拿到全量数据后,对数据进行清洗。在这个过程中发现数据质量非常不理想,很多字段的缺失值占比很大,个别字段也有异常值,总体样本中能使用的记录锐减。一开始我的处理方法比较简单,对缺失值占比达的字段直接不使用,带来的后果就是输出的第一版分析报告过于简单。 重新回到数据,再次对数据进行摸底,而且也调整分析方法,尝试使用聚类分析方法,按用户活跃渠道,对用进行分群,分群后,再结合其他维度,对用户进行描述。这一次输出的报告还是存在一些问题,最大问题就是用户群之间区别不明显,只能继续修改。中间因为要做另一个分析,用户画像分析就临时先放一边。 完成另一个分析后,继续回到产品用户画像分析,这次同事提出了一些建议,在没有更好的思路前,我根据同事的建议第三次修改分析报告。当然还是要先处理数据,这次我对异常值、缺失值就行了处理,异常值使用的是盖帽法,对缺失值,在一些字段中用 0 填补,这样增加了可使用的维度。数据清洗完后,对连续变量进行分箱...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

阳光书坊+ 关注
实名认证
内容提供者

阳光书坊,传播未来

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部