机器学习,如何理解sklearn的独热编码器OneHotEncoder?发布于2024年01月22日 python 在本文中,苏南大叔准备讲解一下sklearn比较常用的独热编码器,英文名是OneHotEncoder。独热编码主要用于分类特征的各个取值之间是无序的情况,各种特征之间理论上并没有顺序或者大小的关系。但是为了机器学习... 阅读更多
机器学习,分析认识sklearn的OrdinalEncoder编码器发布于2024年01月21日 python sklearn里面内置了很多编码器,用于把人类认识的单词转化为程序认识的数字。本文描述第二个编码器OrdinalEncoder(序数编码器),它和上一个LabelEncoder在编码的原理上是很相似的。但是,它接受... 阅读更多
如何修改sklearn的Label编码器?自定义classes_属性?发布于2024年01月20日 python 苏南大叔在本文中,将继续回顾一下sklearn中的LabelEncoder编码器,这里有一个小小的问题,就是可能对其中的分类字典.classes_里的“单词”顺序不满意。那么,本文里面就是研究这种sklearn自定... 阅读更多
基于python,中文汉字如何转unicode编码?编码转汉字发布于2024年01月19日 python 上一篇文章里面,苏南大叔猜测LabelEncoder对汉字进行编码后,是按照unicode编码表进行排序的。那么,是不是如苏南大叔所猜测的那样呢?这就引出了本文的内容:汉字如何转unicode编码?unicode编... 阅读更多
机器学习,如何理解sklearn编码器LabelEncoder?发布于2024年01月18日 python 苏南大叔基于sklearn的各种预测方法做过很多预测了,大家可能也已经意识到了:这些预测都是对数字进行预测的。而实际的问题里面,必然不会直接给出的是代码所需要的各种数字,而是各种人类能够理解的各种单词文字。那么,从... 阅读更多