机器学习xgboost模型,特性重要性输出的依据是什么?发布于2024年09月29日 python 本文讨探xgboost的稍稍基础一些的内容:“特征重要性”。对应到数据集里面,就是特征特性features。对于任何一个模型的预测结果来说,它都是对这些特征进行各种分析得出的结论。这些特征都有一个重要性的说法。谁对... 阅读更多
机器学习,如何使用xgboost预测泰坦尼克数据集结果?发布于2024年09月28日 机器学习 对这个泰坦尼克数据集已经反复分析了好多次了,在本文中就根据这个数据集的其中一个版本,做个xgboost的预测。其实,用什么模型来预测,都会有数据结果。不同的就是:预测的精准度的问题。可谓是条条大路通罗马,款款预测有... 阅读更多
机器学习,如何使用fetch_openml加载泰坦尼克数据集?发布于2024年05月12日 机器学习 在sklearn包里面,并不存在titanic.csv数据集文件本身。但是,可以通过fetch_openml()函数扩展到很多数据集,其中就包括titanic数据集。并且,在openml网站上,这个泰坦尼克数据集还... 阅读更多
机器学习数据集,解读泰坦尼克数据,有哪些字段?发布于2024年05月11日 机器学习 继鸢尾花数据集之后,苏南大叔来分析一下机器学习中非常著名的泰坦尼克数据集。这个数据集的标签是“survived”,而字段包括:年龄、阶层、票价、仓号、登船地、是否有亲戚同乘等等。数据表明:泰坦尼克号的乘客里面,最终... 阅读更多
机器学习的算法中,关于预测准确率的N种实现方案发布于2024年05月08日 机器学习 在对各种数据集进行预测的过程中,最后一步总是要显示算法预测的准确度。注意,是准确度accuracy而不是查准率precision,这两个概念很容易混淆。苏南大叔的“程序如此灵动”博客,记录苏南大叔的代码故事。本文测... 阅读更多