大家好,欢迎来到IT知识分享网。
Pandas是Python第三方库,提供高性能易用数据类型和分析工具,pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
与numpy对比区别:

image
2.pandas库怎么用
安装
pip install pandas
导入
import pandas as pd
3.pandas两个数据类型
两个数据类型:Series, DataFrame
Series类型
Series类型由一组数据及与之相关的数据索引组成

image
第一列的0,1,2,3是自动索引,第二列是实际数据值,最后的dtype表示数据类型

image
Series类型数据的常见创建方式
python列表

image
标量值

image
python字典

image
ndarray

image
Series类型数据的基本操作
获得索引和数据

image
更改索引

image
索引

image
切片

image
DataFrame类型
DataFrame类型由共用相同索引的一组列组成,是一个表格型的数据类型,每列值类型可以不同,既有行索引、也有列索引,常用于表达二维数据。

image

image
DataFrame类型数据的常见创建方式
二维ndarray对象

image
一维ndarray、列表、字典、元组或Series构成的字典

image

image

image
DataFrame类型数据的基本操作
获得行列索引和数据

image
更改行列索引

image
选择数据
索引切片获取列数据和单个数据

image
索引切片获取行数据

image
iloc():按照索引的位置来选取,这里要注意这种方式是包含切片的末尾的数据的

image
loc():按照索引index的值选取,如果没有自定义值,行数据也可以通过切片获取。

image

image

image
4.查看数据

imag数据分析-pandas库快速了解e
5.文件数据读取和保存
保存

image
读取
这里多了一列数据是因为上面写入时把索引写入了,可以再写入时去掉index,to_csv(file,index=False)

image
限于篇幅原因,还有更多内容(空值处理,分组,合并,排序,删除等),这个会在后面的具体场景中应用。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/172111.html