梯度提升分类器模型,如何对鸢尾花数据集进行预测?发布于2023年12月26日 python 本文描述sklearn包中的梯度提升分类器模型,英文名是GradientBoostingClassifier。依然还是以最经典的鸢尾花数据集作为数据范例,依然是主打短平快,梯度提升分类器模型的参数细节,并不在本文讨... 阅读更多
python无法卸载怎么办?No Python installation was detected发布于2023年12月24日 python 调试一个paddlepaddle项目,反复安装了四五个版本的python。反复调试半天,最终还发现paddle serving不支持windows系统,这简直是毁三观啊。唉,这新手坑掉的太憋屈了。最终决定把安装的各... 阅读更多
mac系统,如何安装python3?命令行如何识别pip命令?发布于2023年12月23日 python 在mac系统下安装python,是一种很奇怪的体验。安装完python后,命令行里面并没有识别出python这个命令,您说奇怪不奇怪。识别出python后,却依然不能识别pip命令。这奇怪不奇怪?安装完pip命令后... 阅读更多
python读取文本文件,按行分割为list格式的最佳实践发布于2023年12月20日 python 本文的.txt文本转list的问题,还是由机器学习中的CountVectorizer词袋模型所引起的。停用词列表需要一个list格式变量,而停用词列表又基本上都存放在.txt文本文件里面。所以,这里需要对两者做个转... 阅读更多
CountVectorizer模型,如何控制词汇表?fit和transform方法发布于2023年12月19日 python CountVectorizer词袋模型,可以用于语料库的词频统计。对于中文来说,还需要配合类似“结巴分词”之类的分词程序。那么,本文重点要说的是:面对无穷多的语料,CountVectorizer如何控制词汇表数量呢... 阅读更多