dataframe如何改变dtype为Categorical?自定义排序筛选发布于2024年01月23日 python 涉及到一个新的dtype类型:Categorical。如何理解这个Categorical数据类型呢?什么时候使用这个Categorical数据类型呢?如何使用.astype()来改变dataframe的dtype呢... 阅读更多
机器学习,如何理解sklearn的独热编码器OneHotEncoder?发布于2024年01月22日 python 在本文中,苏南大叔准备讲解一下sklearn比较常用的独热编码器,英文名是OneHotEncoder。独热编码主要用于分类特征的各个取值之间是无序的情况,各种特征之间理论上并没有顺序或者大小的关系。但是为了机器学习... 阅读更多
机器学习,分析认识sklearn的OrdinalEncoder编码器发布于2024年01月21日 python sklearn里面内置了很多编码器,用于把人类认识的单词转化为程序认识的数字。本文描述第二个编码器OrdinalEncoder(序数编码器),它和上一个LabelEncoder在编码的原理上是很相似的。但是,它接受... 阅读更多
如何修改sklearn的Label编码器?自定义classes_属性?发布于2024年01月20日 python 苏南大叔在本文中,将继续回顾一下sklearn中的LabelEncoder编码器,这里有一个小小的问题,就是可能对其中的分类字典.classes_里的“单词”顺序不满意。那么,本文里面就是研究这种sklearn自定... 阅读更多
基于python,中文汉字如何转unicode编码?编码转汉字发布于2024年01月19日 python 上一篇文章里面,苏南大叔猜测LabelEncoder对汉字进行编码后,是按照unicode编码表进行排序的。那么,是不是如苏南大叔所猜测的那样呢?这就引出了本文的内容:汉字如何转unicode编码?unicode编... 阅读更多