snownlp情感分析,如何计算获得文本相似度?发布于2022年10月03日 python 苏南大叔在这里讲述:snownlp的最后一个功能“文本相似度”的测试结果。计算上还算简单,就是具体数值的由来,目前还未知。本文描述snownlp的文本相似度的获取方式,方法很简单,就是结果理解上稍稍有点困难。大家好... 阅读更多
snownlp情感分析,如何获得TF和IDF的词频统计信息?发布于2022年10月02日 python 关于词频统计功能,苏南大叔也写过几篇文章了。有现成的CountVectorizer可以使用,也可以手工统计词频。TF就是说对应词在本文中出现的次数概率,越高越好。IDF就是说对应词在其它对比文章中,出现的概率,越少... 阅读更多
snownlp情感分析,如何提取关键词和文章摘要?发布于2022年10月01日 python 前面的文章里面,苏南大叔说了使用jieba分词,提取文章关键词的方式。本文的文字里面,就说一下使用snownlp如何提取文章关键词。同时,这个snownlp框架,还提供了提取文章中心句的功能。不知道效果如何呢?大家... 阅读更多
snownlp的两个鸡肋功能,文字转拼音和简体转繁体发布于2022年09月30日 python 本文说一下snownlp的两个非常鸡肋的功能,一个是文字转拼音,另外一个是简体转繁体。基本上是没啥用,而且效果也不咋地。大家就简单了解一下就好了。snownlp作者要是表示不满,可以留言给我。大家好,这里是苏南大叔... 阅读更多
snownlp对比jieba,如何处理分词和获得分词词性?发布于2022年09月29日 python snownlp在自然语言处理领域,是以情感分析特长而闻名的。它的很多功能和著名的jieba分词相比,两者是有很多重复的功能的。那么,本文就来对比一下snownlp和jieba的分词和获得词性功能。大家好,这里是苏南... 阅读更多