数据可视化,如何理解箱线图?箱线图各元素表示什么含义?发布于2024年11月18日 python 画完了箱线图,如果大家对出来的图像还是一脸蒙圈的话,就证明你并不明白箱线图的含义。在本文中,苏南大叔将对箱线图的含义进行解析。理解为什么要画出对应的盒子模型?游离于箱线图外侧的圆圈,究竟是什么意思?苏南大叔的“程序... 阅读更多
数据可视化,如何利用plot画box箱线图?箱线图基础绘制发布于2024年11月17日 python 书接前文,本文依旧对kaggle竞赛的泰塔尼克号数据进行分析。本文的“数据可视化”将基于部分字段的数据,画箱线图(box)。以展示箱线图的画图python代码为主要目的。苏南大叔的“程序如此灵动”博客,记录苏南大叔... 阅读更多
python计算分位数,系列数据的分位数数学计算方法发布于2024年11月16日 python 分位数并不是百分数,中位数并不是平均数。在相关的数据计算中,这些概念需要明确分辨。否则将无法理解很多内容,比如股票的K线图。本文将再次审视dataframe相关计算中的“分位数”的概念。从原理上再次解释这些分位数是... 阅读更多
数据可视化,以泰坦尼克数据集为例,柱状图展示字段空值率发布于2024年11月12日 python 拿到一个数据集,首先就是要查看数据的合理性,是否存在着一些不合理的值,譬如空值。可以打印所有或者部分数据,然后人眼观测数据。或者通过df.info()之类的方式,数据化查看空值情况。本文讲述的是:图形化显示空值的情... 阅读更多
以kaggle泰坦尼克数据集为例,列举数据集观测的几种手段发布于2024年11月09日 python 继续机器学习的泰塔尼克数据集文章,本文以kaggle竞赛的泰坦尼克数据集为标的物。当然,这个kaggle数据集和其它版本的泰坦尼克数据集也没有太大分别。只不过,kaggle的版本是已经固定切分好的,不用再对数据集进... 阅读更多