python编码问题

1. 代码中字符串的默认编码与代码文件本身的编码一致。

如:str = '中文'

如果是在utf8的文件中,该字符串就是utf8编码,如果是在gb2312的文件中,则其编码为gb2312。

#_*_encoding:gbk_*_

str = '你好'

str.decode('gbk')

str.encode('unicode')


2. python 内部使用unicode编码。以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 

如果字符串是这样定义:s=u'中文'

则该字符串的编码就被指定为unicode了,即python的内部编码,而与代码文件本身的编码无关。

在某些IDE中,字符串的输出总是出现乱码,甚至错误,其实是由于IDE的结果输出控制台自身不能显示字符串的编码,而不是程序本身的问题。


python字符串的encode与decode研究心得乱码问题解决方法

http://www.jb51.net/article/17560.htm


你可能感兴趣的:(python,编码)