python2 中有关文件中文编码的处理方案
发布于 作者:苏南大叔 来源:程序如此灵动~ 我们相信:世界是美好的,你是我也是。平行空间的世界里面,不同版本的生活也在继续...
在说明python
的中文分词库jieba
的时候,苏南大叔使用的是python3
执行的相关代码。那么在python2
下,这个jieba
的测试代码,也是可以运行的。不过,却可能会遇到两个编码有关的错误提示。本文中,苏南大叔就还是以jieba
中文分词这个测试代码为例,说明python2
中可能遇到的编码有关错误提示的解决方案。
本文测试环境是:python2.7
,jieba0.39
。
错误提示一
源码文件自身编码问题导致的错误提示:
SyntaxError: Non-ASCII character '\xe8' in file test.py on line 5, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
解决方案就是在顶部增加个编码说明,不过在官方说明里面,这个说明有很多种写法,苏南大叔就不具体探讨了。大家可以去下面的页面中,选一个自己喜欢的写法。
下面的这个,是苏南大叔选择的一个方案。其中一个方案而已,上述网址中有更多的方案。
# coding=utf-8
错误提示二
下面的这个错误提示,苏南大叔认为要归结于python2
这个编译过程。
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0: ordinal not in range(128)
这个错误,需要设置另外的编码utf-8
。在源码里面增加的python
语句如下:
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
总结
python2
在未来的一段时间内,还会活跃在编程的舞台。不过,既然是过去时了,那么就让他过去吧。
更多苏南大叔的python
经验文字,请点击下面的链接:
如果本文对您有帮助,或者节约了您的时间,欢迎打赏瓶饮料,建立下友谊关系。
本博客不欢迎:各种镜像采集行为。请尊重原创文章内容,转载请保留作者链接。
本博客不欢迎:各种镜像采集行为。请尊重原创文章内容,转载请保留作者链接。