2012年9月30日星期日

Python脚本重定向其输出时的编码问题

python有一个比较烦的问题是,同一段程序,里面有print语句,直接运行时没有问题,一旦将其输出设了个重定向,这个脚本就不正常了,报告UnicodeEncodeError

究其原因,是Python感知到输出到控制台时,会从控制台取当前编码;而重定向后Python程序无法得知写那个文件该用哪个编码(不过为啥不用控制台的值?), 缺省就用了ascii (准确地说,是系统缺省编码sys.getdefaultencoding(),可以在sitecustomize模块里修改。而python3将缺省编码改为utf-8了) 。python - UnicodeDecodeError when redirecting to file - Stack Overflow

解决办法有两个:
 
一个是刚才提到的修改sitecustomize模块(缺省不存在,特意留给用户定制的),在里面调用sys.setdefaultcoding('xxxx')——这个函数python在import site之后就没有了,应用程序的python代码里是没法调的

方法二是shell里设置环境变量PYTHONIOENCODING,设成utf_8或者gbk都可以(只要字符集够) PrintFails - PythonInfo Wiki

本文链接



(automatically copied by ifttt from http://www.cnblogs.com/bamanzi/archive/2012/08/16/python-encoding-when-redirection.html)

没有评论: