hive-导入数据到hive中,中文乱码的问题

菜鸟一枚,知识希望自己遇到的问题,能够为你提供解决问题的思路。

问题描述:在我们将文件导入到hive时候,hive表中出现了乱码的问题。

解决思路:
1.读的时候,是不是乱码问题,这个排除。因为当地保存的就不是乱码。
2.那么有没有是写得时候的编写问题,因为一开始用的是Filewriter,这个的话,默认的是写出的ASCER码值。所以传入到hive中有乱码,在生成数据的代码中修改成

BufferedWriter out=new BufferedWriter(new OutputStreamWriter(new FileOutputStream(outfile),"GBK"));

这样的话,写出来的就是GBK格式的。这样在导入到 hive中,就是中文。
3.可能是hive读取的问题。那么就要设置一些hive中的设置问题。

你可能感兴趣的:(问题)