机器学习,用MultinomialNB多项式贝叶斯分类器进行预测发布于2022年07月16日 python 在自然语言处理方面,对于预测其实有很多的算法。那么,贝叶斯函数就是其中一个最常见的方法。从贝叶斯函数又发展出了一个朴素贝叶斯分类器,而继而又发展出来了一个拉普拉修平滑参数。对于新人来说,是不是有些晕了。那么,现在就... 阅读更多
机器学习,如何利用CountVectorizer来做词频统计?发布于2022年07月15日 python 在python代码中,如何做词频统计呢?如果做的是中文词频统计呢?有哪些地方需要做设置?本文中利用python的CountVectorizer来做词频统计,可以统计英文(以空格分割),也可以统计中文(用逗号分割)。... 阅读更多
vscode编辑器,如何解决相对路径文件读取失败的问题?发布于2022年07月14日 python 在vscode中,使用代码读取文件的时候,如果使用相对路径的话,就可能会出现文件无法找到的情况。实际上,就是当前程序的运行路径问题。相对文件路径就是从当前运行环境上叠加的,而不是当前被运行的代码进行叠加的,所以会出... 阅读更多
jieba结巴分词,分词函数cut和lcut有什么区别?发布于2022年07月13日 python 在结巴分词里面,有个lcut还有个cut函数。那么,这两个函数有什么区别呢?按照既往经验trim和ltrim的区别来说,l意思是left,那么lcut中的l也是left的意思么?这就是本文中要讨论的问题。大家好,这... 阅读更多
jieba结巴分词,如何加载自定义分词词典?条目词性权重发布于2022年07月12日 python jieba结巴分词,如果对于分词结果不满意的话,可以使用load_userdict函数加载自定义分词词典,也可以使用add_word函数加载某一条条目,同时还可以自定义词性和权重,通过调整权重就可以影响最终的分词结... 阅读更多