python教程,如何设置dataframe的describe结果的分位数?
发布于 作者:苏南大叔 来源:程序如此灵动~

本文依然讨论dataframe
的describe
方法的结果,当被统计的数据为数字类型的时候,统计描述的结果中其中有个25%
/50%
/75%
的分位数概念,这个分位数它实际上是可以定制的。

大家好,这里是苏南大叔的“程序如此灵动”博客,这里记录苏南大叔的编程经验文章。本文测试环境:win10
,python@3.11.0
。
正常分位数
可以参考下面的文章,正常来说,对dataframe
进行.describe()
会返回以下分位数:25%
/50%
/75%
。
输出:
定制分位数
这些分位数的计算方式是:以min
为0%
,max
为100%
,进而按比例计算得到对应的分位数。那么,这些百分比其实是可以定制的。定制的方式就是:在.describe()
方法中传递个参数percentiles
,其类型是个list
,也就是说传递的数据是个[]
。
测试代码:

值得特殊说明的是:
- 其中的
50%
【特殊的分位数叫做中位数】是必然被输出。 0%
和100%
可以被输出,虽然和min
、max
意义重复。- 超出上述范围的数据,比如
120%
,是会引发报错输出的。
结束语
中位数50%
是个特殊的分位数,它和min
、max
一样是被固定下来不变的。更多文章,请参考苏南大叔的博客文章:


