snownlp情感分析,如何提取关键词和文章摘要?
发布于 作者:苏南大叔 来源:程序如此灵动~

前面的文章里面,苏南大叔说了使用jieba
分词,提取文章关键词的方式。本文的文字里面,就说一下使用snownlp
如何提取文章关键词。同时,这个snownlp
框架,还提供了提取文章中心句的功能。不知道效果如何呢?

大家好,这里是苏南大叔的程序如此灵动博客,这里记录苏南大叔和计算机代码的故事。本文描述snownlp
的提取文章关键词和文章中心语句的功能。测试环境:win10
,python@3.6.8
,snownlp@0.12.3
。
测试内容
测试内容来自苏南大叔的自述内容:
对比组jieba
提取关键词 【推荐】
作为对比测试,这里先使用已知的jieba
来实现提取文章关键词的目的。(jieba
只有提取关键词功能,没有提取中心句功能)
输出内容:
效果不错,和苏南大叔想的差不多。对于相关函数的说明文章,请参考:
- https://newsn.net/say/jieba-analyse-textrank.html
- https://newsn.net/say/jieba-analyse-extract_tags.html

snownlp
【效果不是很好】
这里使用snownlp
来完成对照组实验对照:
提取文章关键词[TextRank]
输出五个关键词:
惨不忍睹
提取文本摘要[TextRank]【推荐】
输出一句话描述:
效果还行~
分割成句子[Tokenization]
输出一系列句子:
鸡肋鸡肋...
相关链接
- https://github.com/isnowfy/snownlp
- https://newsn.net/say/nlp-code.html
- https://newsn.net/say/python-zip.html
- https://newsn.net/say/jieba.html
- https://newsn.net/say/jieba-cut.html
- https://newsn.net/say/jieba-lcut.html
总结
苏南大叔个人认为,jieba
的输出文章关键字的功能效果不错,比snownlp
效果好。snownlp
的输出中心语句的功能,效果不错,弥补了jieba
相关功能的缺失。最后,snownlp
的Tokenization
功能,不知道干啥的,貌似没有啥用。总结完毕!
snownlp
的相关文章,请参考:


