重庆交通大学信息科学与工程学院实验报告班级:曙光1701班姓名学号:实验项目名称:透视表编程、股票协方差相关系数实验项目性质:验证性、设计性实验所属课程:《数据导入与预处理》实验室(中心):语音楼八楼指导教师:实验完成时间:2019年11月23日一、实验目的了解和掌握透视表进行数据预处理方法
了解和掌握协方差和相关系数的计算
二、实验要求1
使用python的pandas进行操作
涉及知识包括:1
数据框的增删查改;2
批量读取数据;3
变量类型的转换;4
数据框的重塑与合并;5
生成数据透视表
提交模块化的实验程序源代码,给出实验结果
简述程序的测试过程,提交实录的输入、输出文件;三、实验步骤示例(仅供参考)(1)
flu_data数据集①读取flu_data2015年的数据,并展示查看数据查看其格式代码如下:importpandasaspdimportnumpyasnpimportosimportreos
chdir('C:/Users/11494/Desktop/4flu_data/flu_data')data0=pd
read_csv("by_year/2015
csv",encoding="gbk")data0
head()data0
tail()②对2015年的数据进行预处理
代码如下):data0
drop("Unnamed:0",axis=1,inplace=True)col_name=data0
iloc[1]data0
columns=col_namedata0
drop([0,1,len(data0)-1],axis=0,inplace=True)data0
head(③批量读取连接数据④定义函数用于批量读取及拼接数据,并在读取过程中使用上述Preprogress的函数进行预处理
⑤重塑other_data的列名,使其dat一致,使用0对缺