电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

Python科学计算与数据处理pandas的数据结构入门VIP免费

Python科学计算与数据处理pandas的数据结构入门_第1页
1/16
Python科学计算与数据处理pandas的数据结构入门_第2页
2/16
Python科学计算与数据处理pandas的数据结构入门_第3页
3/16
Python科学计算与数据处理pandas的数据结构入门熊猫条目目录熊猫的数据结构介绍了系列数据框架索引对象的基本功能,重新索引指定轴上的丢弃项索引、选择和过滤算术运算和数据对齐功能应用和映射排序和排序具有重复值的轴索引目录摘要和计算描述统计相关系数和协方差唯一值、值计数和成员处理缺失数据过滤缺失数据填充缺失数据层二级索引根据排序摘要统计重新排列排序顺序。使用数据框架的列。其他与熊猫相关的话题。熊猫包含先进的数据结构和操作工具,使数据分析更快更简单。它建立在NumPy之上,使以NumPy为中心的应用程序更加容易。因为Series和DataFrame经常使用,所以将它们引入本地命名空间更方便。从Frompandasimportseries开始,dataframemportpandassappandas数据结构介绍系列创建一个类似于一维数组的对象,它由一组数据(各种NumPy数据类型)和一组与之相关的数据标记(即索引)组成。最简单的系列只能从一组数据中生成:obj=系列(,,)objdtype:int熊猫。序列的字符串表示如下:左边是索引,右边是值。由于没有为数据指定索引,因此会自动创建一个到N的整数索引(N是数据的长度)。序列的数组表示和索引对象可以通过序列的值和索引属性获得:objvaluesray(,,dttype=INT)objindexindindex(,,DTYPE=#INT#)熊猫的数据结构介绍,通常希望创建的序列将有一个可以标记每个数据点的索引:OBJ=序列(,,,Index=#D#,B#,A#,C#)OBJDBACDTYPE:intobINDEX(U#D#,与普通的NumPy数组相比,熊猫的数据结构可以通过索引在序列中选择一个或一组值:obj#A#obj#d#=obj#C##A##d#caddtype:int熊猫数据结构简介NumPy数组操作(例如,基于布尔数组的过滤、标量乘法、数学函数的应用等。)将保留索引和值之间的链接:objobjobj*npexp(obj)dbacdtype:floatpandas数据结构简介还可以将序列视为固定长度的有序字典,因为它是索引值到数据值的映射。它可以用于许多最初需要字典参数的函数:#b#inobjtrue#e#inobjfalsepanda的数据结构介绍,如果数据存储在Python字典中,也可以直接从该字典创建系列:sdata={#ohio#:,#Texas#:,#Oregon#:,#Utah#:}obj=Series(sdata)objoiooregontexutahdtype:int熊猫介绍,如果只传入一个字典,结果系列中的索引就是原始字典的键(有序排列)。在该示例中,将找到与各州索引匹配的sdata值,并将其放在相应的位置,但是由于找不到对应于加利福尼亚州的sdata值,因此结果是NaN(即非数字)州=#California#、俄亥俄#、俄勒冈#、德克萨斯#OBJ=系列(SDATA,索引=州)OBJCALIFORNIANanoHioOregonTexastype:FLOATAMANS数据结构简介NAN用于表示缺失值或NA值。熊猫的是和不是函数可用于检测丢失的数据:pdis(obj)#Series有一个类似的示例方法:加利福尼亚真#objs()ohiofalsoregonfalsfalsfalsfalsdttype:boolpdnot(obj)加利福尼亚假脱机工作的数据结构对于许多应用程序来说,Series域的一个重要功能是在算术运算中自动对齐不同索引的数据。objobjobjcaliforianhioregontextasuthandtype:FLOAT熊猫的数据结构介绍了系列对象本身及其索引具有名称属性,该属性与熊猫的其他关键功能密切相关:objname=#POPULATION#OBJINDEXNAME=#STATE#OBJSTATECALIENANIONOHIOREGONTEXANAME:POPULATION,DTYPE:FLOAT熊猫系列的索引可以通过赋值就地修改:objobjindex=#Bob##Steve###Jeff##Ryan#OBJBOBBSTEVEJEFERANDTYPE:INTPANDAS数据结构介绍数据结构)。数据框架既有行索引又有列索引,可以看作是由系列组成的字典(共享相同的索引)。与其他类似的数据结构(如r的数据框架)相比,数据框架中面向行和面向列的操作基本平衡。事实上,数据框架中的数据存储在一个或多个二维块中(而不是list、字典或其他一维数据结构)。熊猫的数据结构引入了许多构建数据框架的方法。最常用的方法之一是直接传递到由等长列表或NumPy数组组成的字典中:结果数据框将被自动编入索引(就像序列一样),所有列将按顺序列出DATA={#STATE#:#OHIO#,#OHIO#,#Nevada#,数据结构#NEVADA#,#year#:,,,,#pop#:,,}frame=数据框(数据)框架引入了如果指定列序列,数据帧的列将按指定的顺序排列:像序列一样,如果在数据中找不到传入的列,将生成NA...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

Python科学计算与数据处理pandas的数据结构入门

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部