鸢尾花数据集为例,理解pandas的dataframe类型的维度特征
发布于 作者:苏南大叔 来源:程序如此灵动~
苏南大叔曾经说过,dataframe类型就类似于以前的数组类型,所以它也有维度尺寸形状之类的信息。本文中,苏南大叔依然以鸢尾花数据集为例,分析dataframe类型的三个属性信息。

苏南大叔的程序如此灵动博客,记录苏南大叔的代码所学所想。测试环境:win10,python@3.11.0。本文分析dataframe类型的ndim,shape,size属性特征。
获得鸢尾花dataframe
这里就是单纯的为了获得dataframe对象,不解释。
import pandas as pd
data_url = "http://download.tensorflow.org/data/iris_training.csv"
column_names = ["萼长", "萼宽", "瓣长", "瓣宽", "种类"]
df = pd.read_csv(data_url, header=0, names=column_names)
print(df.ndim) # 维度 2
print(df.size) # 尺寸 600
print(df.shape) # 形状(120,5)
print(df.dtypes)已知这个tensorflow版本的鸢尾花数据,已知除去假冒的表头,一共有120条数据,字段一共五个。参考:

ndim维度
df.ndim这个取值是2,苏南大叔的理解是:二维数组。
size尺寸
df.size这个取值是600,苏南大叔的理解是:120条数据 * 5列 = 600 。一共600个数据。
shape形状
df.shape形状取值是(120,5),苏南大叔的理解是:(行数,列数)。
dtypes类型
df.dtypes输出:
萼长 float64
萼宽 float64
瓣长 float64
瓣宽 float64
种类 int64
dtype: object其他的操作
还可以使用head()或者tail(),或者直接打印df来直观的观察这个数据。
print(df.head())
print(df.tail())
print(df)
print(df.head(3))
print(df.tail(3))还可以使用.describe()查看相关统计数据。参考文字:
print(df.describe())相关链接
- https://newsn.net/say/pandas-dataframe.html
- https://newsn.net/say/dataframe-drop.html
- https://newsn.net/say/dataframe-copy.html
总结
更多python相关经验文字,请点击苏南大叔的博客: