package com.ncss.test.yfJunit; import java.util.ArrayList; import java.util.List; public class BN { //s表示要截取的字符串 length要截取的字符串的长度 list public static void bSubstring(String s, int length, List<String> list) throws Exception{ byte[] bytes = s.getBytes("Unicode"); int n = 0; // 表示当前的字节数 int i = 2; // 要截取的字节数,从第3个字节开始 for (; i < bytes.length && n < length; i++){ // 奇数位置,如3、5、7等,为UCS2编码中两个字节的第二个字节 if (i % 2 == 1){ n++; // 在UCS2第二个字节时n加1 }else{ // 当UCS2编码的第一个字节不等于0时,该UCS2字符为汉字,一个汉字算两个字节 if (bytes[i] != 0){ n++; } } } // 如果i为奇数时,处理成偶数 if (i % 2 == 1){ // 该UCS2字符是汉字时,去掉这个截一半的汉字 if (bytes[i - 1] != 0){ i = i - 1; }else{// 该UCS2字符是字母或数字,则保留该字符 i = i + 1; } } String str=new String(bytes, 0, i, "Unicode"); list.add(str); if(str!=null && str.length()>0 && ! s.endsWith(str)){ str=new String(bytes, 0, bytes.length, "Unicode").substring(str.length(),s.length()); bSubstring(str,2,list); } // return new String(bytes, 0, i, "Unicode"); } public static void main(String[] args) { try { // System.out.println(BN.bSubstring("我abc汉def字gh",2)); List<String> list=new ArrayList<String>(); BN.bSubstring("我abc汉def字gh2",2,list); for(String st:list){ System.out.println(st+" =="); } } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); } } }