hadoop 输入乱码,非utf-8乱码


hadoop默认为utf-8格式,输入中文汉字时会乱码。

解决办法,转为gbk:

在map函数中

String line=new String(value.getBytes(),0,value.getLength(),"GBK");


你可能感兴趣的:(hadoop,输入乱码,费utf-8乱码)