python,如何实现DataFrame和ndarray的类型互转?发布于2023年04月20日 python 在机器学习领域,基于pandans的dataframe数据类型、基于numpy的ndarray数据类型,都是非常常见的。处理各种原始数据的时候,经常会碰到。那么,不可避免的会碰到两者做类型互转的情况。那么,本文中,... 阅读更多
sklearn,如何理解数据集切割函数train_test_split()?发布于2023年04月19日 机器学习 本文继续描述机器学习里面的sklearn的内容,拿到合适的样本数据集之后,有一个可选的操作就是对样本数据集进行切割,从而分割出用于训练的数据集,和用于验证的数据集。这就引出了本文的数据集切割函数:train_tes... 阅读更多
如何通过pandas读取类似鸢尾花数据集格式的csv文件?发布于2023年04月18日 机器学习 本文还是继续描述sklearn加载鸢尾花数据集的故事,首先,需要明确的是:读取数据集的目的是为了机器学习。所以,本文的需求输入是.csv文件,输出是X和y两个变量。这两个变量的格式,可以是ndarray,还可以是D... 阅读更多
sklearn的Bunch类型,和普通的dict字典类型,有什么区别?发布于2023年04月17日 python Bunch英文的解释是“束; 扎; 大量”等意思,当然,它作为sklearn里面的自定义数据类型。目前,还不知道其正式的类型中文翻译是什么。Bunch类型是基于dict字典类型的,所以,两者有何异同呢?大家好,这里... 阅读更多
如何理解sklearn的load_iris函数?解析出的数据是什么格式?发布于2023年04月16日 机器学习 本文继续讨论sklearn里面的鸢尾花数据集,在上一篇文章里面,苏南大叔对这个鸢尾花数据集做了简要的描述,也给出了获取鸢尾花数据集的几个途径。那么,本文中,就描述一下sklearn里面,如何加载自带的iris鸢尾花... 阅读更多