鸢尾花数据集为例,理解pandas的dataframe类型的维度特征
发布于 作者:苏南大叔 来源:程序如此灵动~ 我们相信:世界是美好的,你是我也是。平行空间的世界里面,不同版本的生活也在继续...
苏南大叔曾经说过,dataframe
类型就类似于以前的数组类型,所以它也有维度尺寸形状之类的信息。本文中,苏南大叔依然以鸢尾花数据集为例,分析dataframe
类型的三个属性信息。
苏南大叔的程序如此灵动博客,记录苏南大叔的代码所学所想。测试环境:win10
,python@3.11.0
。本文分析dataframe
类型的ndim
,shape
,size
属性特征。
获得鸢尾花dataframe
这里就是单纯的为了获得dataframe
对象,不解释。
import pandas as pd
data_url = "http://download.tensorflow.org/data/iris_training.csv"
column_names = ["萼长", "萼宽", "瓣长", "瓣宽", "种类"]
df = pd.read_csv(data_url, header=0, names=column_names)
print(df.ndim) # 维度 2
print(df.size) # 尺寸 600
print(df.shape) # 形状(120,5)
print(df.dtypes)
已知这个tensorflow
版本的鸢尾花数据,已知除去假冒的表头,一共有120条数据,字段一共五个。参考:
ndim
维度
df.ndim
这个取值是2
,苏南大叔的理解是:二维数组。
size
尺寸
df.size
这个取值是600
,苏南大叔的理解是:120条数据 * 5列 = 600 。一共600个数据。
shape
形状
df.shape
形状取值是(120,5),苏南大叔的理解是:(行数,列数)。
dtypes
类型
df.dtypes
输出:
萼长 float64
萼宽 float64
瓣长 float64
瓣宽 float64
种类 int64
dtype: object
其他的操作
还可以使用head()
或者tail()
,或者直接打印df
来直观的观察这个数据。
print(df.head())
print(df.tail())
print(df)
print(df.head(3))
print(df.tail(3))
还可以使用.describe()
查看相关统计数据。参考文字:
print(df.describe())
相关链接
- https://newsn.net/say/pandas-dataframe.html
- https://newsn.net/say/dataframe-drop.html
- https://newsn.net/say/dataframe-copy.html
总结
更多python
相关经验文字,请点击苏南大叔的博客:
如果本文对您有帮助,或者节约了您的时间,欢迎打赏瓶饮料,建立下友谊关系。
本博客不欢迎:各种镜像采集行为。请尊重原创文章内容,转载请保留作者链接。
本博客不欢迎:各种镜像采集行为。请尊重原创文章内容,转载请保留作者链接。