sklearn,如何理解数据集切割函数train_test_split()?发布于2023年04月19日 机器学习 本文继续描述机器学习里面的sklearn的内容,拿到合适的样本数据集之后,有一个可选的操作就是对样本数据集进行切割,从而分割出用于训练的数据集,和用于验证的数据集。这就引出了本文的数据集切割函数:train_tes... 阅读更多
如何通过pandas读取类似鸢尾花数据集格式的csv文件?发布于2023年04月18日 机器学习 本文还是继续描述sklearn加载鸢尾花数据集的故事,首先,需要明确的是:读取数据集的目的是为了机器学习。所以,本文的需求输入是.csv文件,输出是X和y两个变量。这两个变量的格式,可以是ndarray,还可以是D... 阅读更多
如何理解sklearn的load_iris函数?解析出的数据是什么格式?发布于2023年04月16日 机器学习 本文继续讨论sklearn里面的鸢尾花数据集,在上一篇文章里面,苏南大叔对这个鸢尾花数据集做了简要的描述,也给出了获取鸢尾花数据集的几个途径。那么,本文中,就描述一下sklearn里面,如何加载自带的iris鸢尾花... 阅读更多