| 编码集 | 一个英文字符所占字节数 | 一个中文字符所占字节数 |
|---|---|---|
| UTF-8 | 1 | 3 |
| UTF-16 | 4 | 4 |
| UTF-16BE | 2 | 2 |
| UTF-16LE | 2 | 2 |
| UTF-32 | 4 | 4 |
| UTF-32LE | 4 | 4 |
| UTF-32BE | 4 | 4 |
| UNICODE | 4 | 4 |
| GBK | 1 | 2 |
| GB2312 | 1 | 2 |
| GB18030 | 1 | 2 |
| ISO8859-1 | 1 | 1 |
| BIG5 | 1 | 2 |
| ASCII | 1 | 1 |
统计原理:
将一个中文字符&一个英文字符分别按照不同的charset,用getBytes().length方法获取其对应的长度
例如 "啊".getBytes("UTF-8").length
可参考博文https://www.cnblogs.com/Qian123/p/5799835.html