1pandas—入门目录pandas的数据结构介绍SeriesDataFrame索引对象基本功能重新索引丢弃指定轴上的项索引、选取和过滤算术运算和数据对齐函数应用和映射排序和排名带有重复值的轴索引2目录汇总和计算描述统计相关系数与协方差唯一值、值计数以及成员资格处理缺失数据滤除缺失数据填充缺失数据层次化索引重排分级顺序根据级别汇总统计使用DataFrame的列其他有关pandas的话题34pandas含有使数据分析工作变得更快更简单的高级数据结构和操作工具
它是基于NumPy构建的,让以NumPy为中心的应用变得更加简单
因为Series和DataFrame用的次数非常多,所以将其引入本地命名空间中会更方便
>>>frompandasimportSeries,DataFrame>>>importpandasaspdpandas的数据结构介绍SeriesSeries是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成
仅由一组数据即可产生最简单的Series:5>>>obj=Series([4,7,-5,3])>>>obj04172-533dtype:int64pandas的数据结构介绍Series的字符串表现形式为:索引在左边,值在右边
由于没有为数据指定索引,于是会自动创建一个0到N-1(N为数据的长度)的整数型索引
可以通过Series的values和index属性获取其数组表示形式和索引对象:6>>>obj
valuesarray([4,7,-5,3],dtype=int64)>>>obj
indexInt64Index([0,1,2,3],dtype='int64')pandas的数据结构介绍通常希望所创建的Series带有一个可以对各个数据点进