文本文件进行UTF-8解码的过程

UTF-8:一种对unicode优化的编码表,最多三个字节表示一个字。

文本文件进行UTF-8解码的过程_第1张图片
image.png

如图:
1、如果第一个字节第一位是0,则拿第一个字节去查iOS 8859编码表进行解码。
2、如果第一个字节以110开头,第二个字节以10开头,第三个字节不是10开头,则拿第一、二两个字节去查UTF-8编码表。
3、如果第一个字节以110开头,第二、三个字节都以10开头,则拿这三个字节去查UTF-8编码表。

你可能感兴趣的:(文本文件进行UTF-8解码的过程)