python代码,如何手工统计一篇文章的词频Top5分词?发布于2022年09月27日 python 前面的文章里面提到:结巴分词基于TF-IDF算法来提取标签。其中的TF就是词频,算法上就是统计出目标词出现的次数,然后再除以一个文章的词儿总数(或者其它的数)。TF要求:目标词在当前文章里面出现的次数多,词频就越高... 阅读更多
python如何利用pathlib模块,获得指定目录下的文件列表发布于2022年09月26日 python 书接上文,需求是获得指定目录下面的文件或文件夹名称集合。上一篇文章中,使用了python下的glob.glob()以及glob.iglob()来实现这个需求。但是,遗留着一个重要问题,就是一些特殊文件(例如.hta... 阅读更多
python如何利用glob模块,获得指定目录下的文件列表发布于2022年09月25日 python 本文要说的是python下的glob模块,它可以获取指定目录下面的文件列表。使用起来也很简单,就一个函数。然后加个类似正则的文件名字符串表述,就可以了。但是,这个glob模块有个天然的问题,究竟是什么问题呢?请阅读... 阅读更多
nodejs代码,如何利用zlib压缩和还原一段文字?发布于2022年09月24日 node 本文描述一下zlib库里面的几个加密(压缩)解密(解压缩)函数。实际上是压缩解压缩的过程,但是,因为结果对于大家来说,是个天书,所以也算加密解密的过程。本文共涉及三种压缩的方式:deflate、deflateRaw... 阅读更多
颠覆三观,javascript中的this到底指代的是啥?发布于2022年09月23日 HTML 苏南大叔准备在本文中描述一个普通人不会这么想的谜题,就是非正常的代码用法,但是也没有报错,运算结果也比较出人意料。甚至于在本文中,node环境和浏览器环境下,运算的结果都有很大差别。大家好,这里是苏南大叔的程序如此... 阅读更多