snownlp情感分析,如何提取关键词和文章摘要?发布于2022年10月01日 python 前面的文章里面,苏南大叔说了使用jieba分词,提取文章关键词的方式。本文的文字里面,就说一下使用snownlp如何提取文章关键词。同时,这个snownlp框架,还提供了提取文章中心句的功能。不知道效果如何呢?大家... 阅读更多
snownlp的两个鸡肋功能,文字转拼音和简体转繁体发布于2022年09月30日 python 本文说一下snownlp的两个非常鸡肋的功能,一个是文字转拼音,另外一个是简体转繁体。基本上是没啥用,而且效果也不咋地。大家就简单了解一下就好了。snownlp作者要是表示不满,可以留言给我。大家好,这里是苏南大叔... 阅读更多
snownlp对比jieba,如何处理分词和获得分词词性?发布于2022年09月29日 python snownlp在自然语言处理领域,是以情感分析特长而闻名的。它的很多功能和著名的jieba分词相比,两者是有很多重复的功能的。那么,本文就来对比一下snownlp和jieba的分词和获得词性功能。大家好,这里是苏南... 阅读更多
python语言,如何理解zip函数?如何打印zip类型数据?发布于2022年09月28日 python 在python语言里面,有很多奇怪的数据类型,其中一个就是zip数据类型。据苏南大叔的理解,它和平时所说的zip压缩格式,还是不一样的。苏南大叔的理解是:zip类型就是个类似dict类型的数据类型。具有的公用就两个... 阅读更多
python代码,如何手工统计一篇文章的词频Top5分词?发布于2022年09月27日 python 前面的文章里面提到:结巴分词基于TF-IDF算法来提取标签。其中的TF就是词频,算法上就是统计出目标词出现的次数,然后再除以一个文章的词儿总数(或者其它的数)。TF要求:目标词在当前文章里面出现的次数多,词频就越高... 阅读更多