按字符节,截取字符串的长度

package com.ncss.test.yfJunit;

import java.util.ArrayList;
import java.util.List;

public class BN {
         //s表示要截取的字符串  length要截取的字符串的长度 list 
	 public static void bSubstring(String s, int length, List<String> list) throws Exception{

		 byte[] bytes = s.getBytes("Unicode");

		int n = 0; // 表示当前的字节数

		int i = 2; // 要截取的字节数,从第3个字节开始

		for (; i < bytes.length && n < length; i++){
		// 奇数位置,如3、5、7等,为UCS2编码中两个字节的第二个字节
			if (i % 2 == 1){
	
			  n++; // 在UCS2第二个字节时n加1
	
			}else{
	// 当UCS2编码的第一个字节不等于0时,该UCS2字符为汉字,一个汉字算两个字节
				if (bytes[i] != 0){
		              n++;
		           }
			}
		}
		// 如果i为奇数时,处理成偶数
		if (i % 2 == 1){
		// 该UCS2字符是汉字时,去掉这个截一半的汉字
			if (bytes[i - 1] != 0){
				i = i - 1;
			}else{// 该UCS2字符是字母或数字,则保留该字符
				i = i + 1;
			}
        }
		String str=new String(bytes, 0, i, "Unicode");
		list.add(str);
		if(str!=null && str.length()>0 && ! s.endsWith(str)){
			str=new String(bytes, 0, bytes.length, "Unicode").substring(str.length(),s.length());
			bSubstring(str,2,list);
		}

//		return new String(bytes, 0, i, "Unicode");


	    }

	
	public static void main(String[] args) {
		 try {
//			System.out.println(BN.bSubstring("我abc汉def字gh",2));
			 List<String> list=new ArrayList<String>();
			 BN.bSubstring("我abc汉def字gh2",2,list);
			 for(String st:list){
				 System.out.println(st+"  ==");
			 }
		} catch (Exception e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		
	}
}

 

你可能感兴趣的:(String 字符集截取长度)