java.util.Arrays的二分查找

今天程序中需要用到最快的查询算法,本来想自己写,可是突然感觉java提供强大的collection操作类库应该包含这些。于是搜了一番,发现,确实如我所想。自己写了个exaple:
int[] arr=new int[]{5,2,7,9,4,9,3,2};
		Arrays.sort(arr);
		for(int a:arr){
			System.out.print(a+" ");
		}
		System.out.println();
		System.out.print(Arrays.binarySearch(arr, 12));


但是java自带的jdk存在bug。如下是它的源码,
1:     public static int binarySearch(int[] a, int key) {
2:         int low = 0;
3:         int high = a.length - 1;
4: 
5:         while (low <= high) {
6:             int mid = (low + high) / 2;
7:             int midVal = a[mid];
8:
9:             if (midVal < key)
10:                 low = mid + 1;
11:             else if (midVal > key)
12:                 high = mid - 1;
13:             else
14:                 return mid; // key found
15:         }
16:         return -(low + 1);  // key not found.
17:     }



bug出现在第6行:

6:             int mid =(low + high) / 2;

在一般情况下, 这个语句是不会出错的, 但是, 当low+high的值超过了最大的正int值 (231 - 1) 的时候, mid会变成负值,  这个时候, 会抛出ArrayIndexOutOfBoundsException 异常..

所以当一个数组包含超过2的30次方 个元素的时候, 就很可能会带来问题... 当然, 在一般的应用里面, 很少数组会包含那么多元素, 但是现在这样的情况已经越来越多了, 比如Google的海量运算..

那如何解决这个问题?

很简单, 修改这行语句为:

6:             int mid = low + ((high - low) / 2);
或者
6:             int mid = (low + high) >>> 1;


在c或者c++中, 则可以如下实现:
6:             mid = ((unsigned) (low + high)) >> 1;

你可能感兴趣的:(java,jdk,c,算法,Google)