程序如此灵动~ - 做一名不被定义的苏南大叔

苏南大叔 » 程序如此灵动~

sklearn，如何理解数据集切割函数train_test_split()？

发布于2023年04月19日

本文继续描述机器学习里面的sklearn的内容，拿到合适的样本数据集之后，有一个可选的操作就是对样本数据集进行切割，从而分割出用于训练的数据集，和用于验证的数据集。这就引出了本文的数据集切割函数：train_tes...

sklearn，如何读取类似鸢尾花数据集格式的csv文件？

发布于2023年04月18日

本文还是继续描述sklearn加载鸢尾花数据集的故事，首先，需要明确的是：读取数据集的目的是为了机器学习。所以，本文的需求输入是.csv文件，输出是X和y两个变量。这两个变量的格式，可以是ndarray，还可以是D...

sklearn的Bunch类型，和普通的dict字典类型，有什么区别？

发布于2023年04月17日

Bunch英文的解释是“束; 扎; 大量”等意思，当然，它作为sklearn里面的自定义数据类型。目前，还不知道其正式的类型中文翻译是什么。Bunch类型是基于dict字典类型的，所以，两者有何异同呢？大家好，这里...

如何理解sklearn的load_iris函数？解析出的数据是什么格式？

发布于2023年04月16日

本文继续讨论sklearn里面的鸢尾花数据集，在上一篇文章里面，苏南大叔对这个鸢尾花数据集做了简要的描述，也给出了获取鸢尾花数据集的几个途径。那么，本文中，就描述一下sklearn里面，如何加载自带的iris鸢尾花...

如何获得机器学习的鸢尾花数据集？有哪几种鸢尾花？

发布于2023年04月15日

本篇文章的大纲内容使用chatgpt自动生成，用时三秒，然后由苏南大叔进行补充润色，用时半天。本文的主要内容描述的是机器学习里面最著名的数据集之一：鸢尾花数据集。大家好，这里是苏南大叔的“程序如此灵动”博客，记录苏...