sklearn,如何利用决策树分类器模型预测类鸢尾花数据集?发布于2023年04月23日 机器学习 鸢尾花数据集是机器学习的经典样本,而决策树模型也是经典的分类器算法。那么,两者的碰撞将会出现什么样的火花呢?本文主体还是由chatgpt生成,生成用时三秒。然后由苏南大叔整理文章,用时三小时。本文中将要使用机器学习... 阅读更多
python,如何统计DataFrame类型变量中成员出现的次数?发布于2023年04月22日 python 在机器学习中,DataFrame和ndarray作为数据样本的常见数据类型。对此类数据的统计和加工是必不可少的操作。在前面的文章里面,有个需求是对ndarray中的值进行出现次数的统计。那么,在本文的需求中,这个需... 阅读更多
python,如何统计ndarray类型变量中某个值出现的次数?发布于2023年04月21日 python 本文的描述对象还是基于numpy的ndarray类型变量,这个类型的变量类似没有表头的excel表,而且具有非常好的柔韧性,可以利用reshape来修改其形状。类似于nlp的词频统计功能,本文的需求是对成员值的出现... 阅读更多
python,如何实现DataFrame和ndarray的类型互转?发布于2023年04月20日 python 在机器学习领域,基于pandans的dataframe数据类型、基于numpy的ndarray数据类型,都是非常常见的。处理各种原始数据的时候,经常会碰到。那么,不可避免的会碰到两者做类型互转的情况。那么,本文中,... 阅读更多
sklearn,如何理解数据集切割函数train_test_split()?发布于2023年04月19日 机器学习 本文继续描述机器学习里面的sklearn的内容,拿到合适的样本数据集之后,有一个可选的操作就是对样本数据集进行切割,从而分割出用于训练的数据集,和用于验证的数据集。这就引出了本文的数据集切割函数:train_tes... 阅读更多