我们相信:世界是美好的,你是我也是。平行空间的世界里面,不同版本的生活也在继续...

苏南大叔曾经说过,dataframe类型就类似于以前的数组类型,所以它也有维度尺寸形状之类的信息。本文中,苏南大叔依然以鸢尾花数据集为例,分析dataframe类型的三个属性信息。

苏南大叔:鸢尾花数据集为例,理解pandas的dataframe类型的维度特征 - dataframe维度特征
鸢尾花数据集为例,理解pandas的dataframe类型的维度特征(图2-1)

苏南大叔的程序如此灵动博客,记录苏南大叔的代码所学所想。测试环境:win10python@3.11.0。本文分析dataframe类型的ndimshapesize属性特征。

获得鸢尾花dataframe

这里就是单纯的为了获得dataframe对象,不解释。

import pandas as pd
data_url = "http://download.tensorflow.org/data/iris_training.csv"
column_names = ["萼长", "萼宽", "瓣长", "瓣宽", "种类"]
df = pd.read_csv(data_url, header=0, names=column_names)
print(df.ndim)      # 维度 2
print(df.size)      # 尺寸 600
print(df.shape)     # 形状(120,5)
print(df.dtypes)

已知这个tensorflow版本的鸢尾花数据,已知除去假冒的表头,一共有120条数据,字段一共五个。参考:

苏南大叔:鸢尾花数据集为例,理解pandas的dataframe类型的维度特征 - 运行结果
鸢尾花数据集为例,理解pandas的dataframe类型的维度特征(图2-2)

ndim维度

df.ndim

这个取值是2,苏南大叔的理解是:二维数组。

size尺寸

df.size

这个取值是600,苏南大叔的理解是:120条数据 * 5列 = 600 。一共600个数据。

shape形状

df.shape

形状取值是(120,5),苏南大叔的理解是:(行数,列数)。

dtypes类型

df.dtypes

输出:

萼长    float64
萼宽    float64
瓣长    float64
瓣宽    float64
种类      int64
dtype: object

其他的操作

还可以使用head()或者tail(),或者直接打印df来直观的观察这个数据。

print(df.head())
print(df.tail())
print(df)
print(df.head(3))
print(df.tail(3))

还可以使用.describe()查看相关统计数据。参考文字:

print(df.describe())

相关链接

总结

更多python相关经验文字,请点击苏南大叔的博客:

如果本文对您有帮助,或者节约了您的时间,欢迎打赏瓶饮料,建立下友谊关系。
本博客不欢迎:各种镜像采集行为。请尊重原创文章内容,转载请保留作者链接。

 【福利】 腾讯云最新爆款活动!1核2G云服务器首年50元!

 【源码】本文代码片段及相关软件,请点此获取更多信息

 【绝密】秘籍文章入口,仅传授于有缘之人   python