机器学习数据集,解读泰坦尼克数据,有哪些字段?发布于2024年05月11日 机器学习 继鸢尾花数据集之后,苏南大叔来分析一下机器学习中非常著名的泰坦尼克数据集。这个数据集的标签是“survived”,而字段包括:年龄、阶层、票价、仓号、登船地、是否有亲戚同乘等等。数据表明:泰坦尼克号的乘客里面,最终... 阅读更多
以鸢尾花数据集为例,如何分析数据字段的相关性?发布于2024年05月10日 python 本文以经典的鸢尾花数据为例,展示dataframe的数据相关性分析功能,也就是说看看各个字段之间相关度有多少。当然,这些相关度的计算,都是基于数字类型的。注意:字符串类型是无法参与相关度计算的。大家好,这里是苏南大... 阅读更多
dataframe数据,df.select_dtypes()根据dtype进行数据筛选发布于2024年05月09日 python 机器学习操作的结构化数据,基本上就是一个又一个的dataframe。而实际的代码层面上来说,对于字符数据又是无法处理的。真正能处理的,只有数字或者浮点数等数据。所以,对于dataframe的数据类型筛选,是比较有必... 阅读更多
机器学习的算法中,关于预测准确率的N种实现方案发布于2024年05月08日 机器学习 在对各种数据集进行预测的过程中,最后一步总是要显示算法预测的准确度。注意,是准确度accuracy而不是查准率precision,这两个概念很容易混淆。苏南大叔的“程序如此灵动”博客,记录苏南大叔的代码故事。本文测... 阅读更多
CatBoost模型,如何对鸢尾花数据集进行预测?发布于2024年05月07日 机器学习 人工智能有很多种算法模型,苏南大叔已经写过很多相关算法文章了。本文要写的是一个catboost算法,来对鸢尾花数据进行处理。看看catboost模型,有什么特殊的地方没有?苏南大叔的“程序如此灵动”博客,记录苏南大... 阅读更多