python2 中有关文件中文编码的处理方案
发布于 作者:苏南大叔 来源:程序如此灵动~

在说明python
的中文分词库jieba
的时候,苏南大叔使用的是python3
执行的相关代码。那么在python2
下,这个jieba
的测试代码,也是可以运行的。不过,却可能会遇到两个编码有关的错误提示。本文中,苏南大叔就还是以jieba
中文分词这个测试代码为例,说明python2
中可能遇到的编码有关错误提示的解决方案。

本文测试环境是:python2.7
,jieba0.39
。
错误提示一
源码文件自身编码问题导致的错误提示:

解决方案就是在顶部增加个编码说明,不过在官方说明里面,这个说明有很多种写法,苏南大叔就不具体探讨了。大家可以去下面的页面中,选一个自己喜欢的写法。
下面的这个,是苏南大叔选择的一个方案。其中一个方案而已,上述网址中有更多的方案。
错误提示二
下面的这个错误提示,苏南大叔认为要归结于python2
这个编译过程。
这个错误,需要设置另外的编码utf-8
。在源码里面增加的python
语句如下:

总结
python2
在未来的一段时间内,还会活跃在编程的舞台。不过,既然是过去时了,那么就让他过去吧。
更多苏南大叔的python
经验文字,请点击下面的链接:


