sklearn,如何理解数据集切割函数train_test_split()?发布于2023年04月19日 机器学习 本文继续描述机器学习里面的sklearn的内容,拿到合适的样本数据集之后,有一个可选的操作就是对样本数据集进行切割,从而分割出用于训练的数据集,和用于验证的数据集。这就引出了本文的数据集切割函数:train_tes... 阅读更多
sklearn,如何读取类似鸢尾花数据集格式的csv文件?发布于2023年04月18日 机器学习 本文还是继续描述sklearn加载鸢尾花数据集的故事,首先,需要明确的是:读取数据集的目的是为了机器学习。所以,本文的需求输入是.csv文件,输出是X和y两个变量。这两个变量的格式,可以是ndarray,还可以是D... 阅读更多
sklearn的Bunch类型,和普通的dict字典类型,有什么区别?发布于2023年04月17日 python Bunch英文的解释是“束; 扎; 大量”等意思,当然,它作为sklearn里面的自定义数据类型。目前,还不知道其正式的类型中文翻译是什么。Bunch类型是基于dict字典类型的,所以,两者有何异同呢?大家好,这里... 阅读更多
如何理解sklearn的load_iris函数?解析出的数据是什么格式?发布于2023年04月16日 机器学习 本文继续讨论sklearn里面的鸢尾花数据集,在上一篇文章里面,苏南大叔对这个鸢尾花数据集做了简要的描述,也给出了获取鸢尾花数据集的几个途径。那么,本文中,就描述一下sklearn里面,如何加载自带的iris鸢尾花... 阅读更多
如何获得机器学习的鸢尾花数据集?有哪几种鸢尾花?发布于2023年04月15日 数据分析 本篇文章的大纲内容使用chatgpt自动生成,用时三秒,然后由苏南大叔进行补充润色,用时半天。本文的主要内容描述的是机器学习里面最著名的数据集之一:鸢尾花数据集。大家好,这里是苏南大叔的“程序如此灵动”博客,记录苏... 阅读更多