hadoop中文乱码问题


我在hadoop中要处理不同编码格式的文件。如:gbk ,utf-8.

hadoop 默认是utf-8 执行结果是Utf-8的正常显示

gbk 的显示乱码

在网上查了 value = new String(text.getBytes(), 0, text.getLength(), encoding);这种形式。

执行结果未变化。

求指导。。。

<!--EndFragment-->

你可能感兴趣的:(hadoop,乱码)