大家都说java使用的字符集是unicode,那么默认编码不就是应该是UTF8,UTF16之类的unicode编码吗?
可是调用Charset.defaultCharset()的结果并非如此。
import java.nio.charset.Charset; public class javaCode { public static void main(String args[]) { String defaultCharsetName=Charset.defaultCharset().displayName(); System.out.println("defaultCharsetName:"+defaultCharsetName); } }
执行结果如下
defaultCharsetName:GBK
多次试验发现,这个默认字符编码是由windows的语言地域里的设定决定的
这个字符编码肯定不是java内部的字符编码,那会不会是文件读入时的字符编码?
先用Emeditor之类的编辑器,生成一个UTF8的txt文件,输入内容:門(door),保存。
用下面的代码读入
import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.nio.charset.Charset; public class javaCode { public static void main(String args[]) { String defaultCharsetName=Charset.defaultCharset().displayName(); System.out.println("defaultCharsetName:"+defaultCharsetName); try { InputStream is = new FileInputStream("F://shifjst.txt"); //等于 InputStreamReader streamReader = new InputStreamReader(is,Charset.defaultCharset()); InputStreamReader streamReader = new InputStreamReader(is); char[] chars = new char[10]; streamReader.read(chars, 0, 10); System.out.println(chars); } catch (FileNotFoundException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }
结果是乱码:
defaultCharsetName:windows-31j
髢?door)
再把那个文件的格式改成shift-jis,正确读出来了。
defaultCharsetName:windows-31j
門(door)
看来,java读入文件时的字符编码是根据系统的默认编码来的。