pip包如何加速下载安装?pip国内镜像地址有哪些?发布于2019年08月22日 python 苏南大叔开始,会偶尔更新一些python的内容。在以后的时间里面,由于一些原因,python的内容会逐渐增多,希望大家能够继续支持苏南大叔。本文说的是pip的国内镜像问题,这些各种命令行install的过程,一般源... 阅读更多
pip安装软件,Caches/pip 目录属主问题的解决方案发布于2019年03月13日 python 在mac环境下,使用pip安装一些包的时候,会有一些奇怪的警告信息。比如提示pip的缓存包属主有问题。虽然安装好的程序体,也是能够正常使用的。但是,看着这些黄色的警告信息总是有些不爽的。对吧?本文就说一下,如何消灭... 阅读更多
python2 中有关文件中文编码的处理方案发布于2018年12月31日 python 在说明python的中文分词库jieba的时候,苏南大叔使用的是python3执行的相关代码。那么在python2下,这个jieba的测试代码,也是可以运行的。不过,却可能会遇到两个编码有关的错误提示。本文中,苏南... 阅读更多
python 正文抽取试验:readability、newspaper发布于2018年12月30日 python 本文中,苏南大叔描述的是:python如何免正则表达式分析出文章正文。当然,这篇文字如果非要往高大上说的话,就可以扯上ai之类的高大上名词。反正,宗旨就是这样的:不写正则表达式,仅使用python现有的第三方模块,... 阅读更多
python 中文分词工具:jieba 结巴分词发布于2018年12月29日 python 通过正文提取算法,拿到正文之后,就可以对正文进行处理了。不过苏南大叔通过不写规则的办法,匹配到的正文内容,效果其实并不是太理想。所以,暂时,还是通过写规则的办法,有针对性地匹配出正文吧。拿到正文之后,苏南大叔计划进... 阅读更多