php转码中的iconv与mb_convert_encoding的理解

由于php内部未采用unicode编码,因此php在处理高阶字符。如中文,日文等时,均有乱码的情况。解决方案就是转码,php有两个主要的转码函数。iconv和mb_convert_encoding。

iconv是c语言中的iconv的包装,但是其底层实现却不一样,linux下通常使用glibc库实现转码,使用系统码表;window下通常使用libiconv库实现转码,自带码表。

mb_convert_encoding是php扩展mbstring的函数,其实现方式是libmbfl库。自带码表。

那么,这两个转码那个好呢?

iconv由于是c语言的包装所以速度最快,但是其实现方法的不同,导致码表上有些许差异。因此可能出现不同平台转码结果不相同的情况。另外iconv如果在转吗中如果不加//IGNORE,就有可能出现转码失败返回FALSE。如utf8编码的中文字符”—”转换到gb2312时会出错。

mb_convert_encoding由于自带码表,所以一致性较好,但是其是扩展方式,必须开启扩展才行,转码速度也比较慢。mb_convert_encoding在不能转码的字符时会强制转换成\0x00\0x80,如从utf8转换成gbk时。

综上,我们可以看出,php中编码没有最好的方案。只能根据项目具体情况。进行取舍。


你可能感兴趣的:(php)