谁说菜鸟不会数据分析(完整)课件•数据分析简介•数据清洗与预处理•描述性统计分析•推论性统计分析•数据可视化目录•大数据处理与机器学习CHAPTER数据分析简介数据分析的定义数据分析旨在帮助企业、组织和个人更好地理解数据,从而做出更科学、更准确的决策
数据分析的流程数据清洗数据分析数据收集数据探索结果呈现数据分析的常用工具01020304ExcelPythonR语言TableauCHAPTER数据清洗与预处理数据清洗缺失值处理删除含有缺失值的行或列
使用平均值、中位数或众数填充缺失值
数据清洗使用插值方法预测缺失值
异常值处理基于统计方法识别异常值
数据清洗根据业务逻辑判断异常值
将异常值替换或删除
数据类型转换数据清洗数据预处理数据预处理010203数据预处理123数据探索010203数据探索数据探索CHAPTER描述性统计分析数据的中心趋势010203平均数中位数众数数据的离散程度方差标准差变异系数数据的分布形态正态分布峰态分布钟形曲线,中间高、两边低,左右对描述数据分布的尖锐或平坦程度,过高或过低的频数
偏态分布数据分布不对称,可能有一侧出现更多数据
CHAPTER推论性统计分析参数与非参数检验参数检验非参数检验方差分析单因素方差分析双因素方差分析相关与回归分析相关分析回归分析用于预测一个因变量与一个或多个自变量之间的关系,并建立回归模型,以便对因变量进行预测和控制
CHAPTER数据可视化图表类型选择柱状图折线图饼图散点图用于比较不同类别之间的数据,适合展示分类数据和连续数据的比较
用于展示数据随时间或用于展示各部分在整体中所占的比例
用于展示两个连续变量之间的关系和分布
其他连续变量的变化趋势
数据可视化工具TableauExcelPowerBI可视化案例分析销售数据分析用户行为分析市场趋势分析通过分析销售数据,使用柱状图和折线图展示不同产品类别和地区的销售趋