二分查找算法在C/C++程序中的应用示例

二分查找算法的思想很简单,《编程珠玑》中的描述: 在一个包含t的数组内,二分查找通过对范围的跟综来解决问题。开始时,范围就是整个数组。通过将范围中间的元素与t比较并丢弃一半范围,范围就被缩小。这个过程一直持续,直到在t被发现,或者那个能够包含t的范围已成为空。
        Donald Knuth在他的《Sorting and Searching》一书中指出,尽管第一个二分查找算法早在1946年就被发表,但第一个没有bug的二分查找算法却是在12年后才被发表出来。其中常见的一个bug是对中间值下标的计算,如果写成(low+high)/2,当low+high很大时可能会溢出,从而导致数组访问出错。改进的方法是将计算方式写成如下形式:low+ ( (high-low) >>1)即可。下面给出修改后的算法代码:

int binarysearch1(int a[],int n,int x)
{
 int l,u,m;
 l=0;u=n;
 while(l<u)
 {
  m=l+((u-l)>>1);
  if(x<a[m])
   u=m;
  else if(x==a[m])
   return m;
  else
   l=m+1;
 }
 return -1;
}

这里注意一点,由于使用的是不对称区间,所以下标的调整看上去有点不规整。一个是u=m,另一个是l=m+1。其实很好理解,调整前区间的形式应该是 [ )的形式,如果中间值比查找值小,那么调整的是左边界,也就是闭的部分,所以加1;否则,调整是右边界,是开的部分,所以不用减1。调整后仍是[ )的形式。当然也可以写成对称的形式。代码如下:

int binarysearch1(int a[],int n,int x)
{
 int l,u,m;
 l=0;u=n-1;
 while(l<=u)
 {
  m=l+((u-l)>>1);
  if(x<a[m])
   u=m-1;
  else if(x==a[m])
   return m;
  else
   l=m+1;
 }
 return -1;
}

这样也看上去比较规整,但是有个不足。如果想把程序改成“纯指针”的形式,就会有麻烦。修改成纯指针的代码如下:

int binarysearch2(int *a,int n,int x)
{
 int *l,*u,*m;
 l=a;u=a+n-1;
 while(l<=u)
 {
  m=l+((u-l)>>1);
  if(x<*m)
   u=m-1;
  else if(x==*m)
   return m-a;
  else
   l=m+1;
 }
 return -1;
}

当n为0时,会引用无效地址。而用非对称区间则不会有这个问题。代码如下:

int binarysearch2(int *a,int n,int x)
{
 int *l,*u,*m;
 l=a;u=a+n;
 while(l<u)
 {
  m=l+((u-l)>>1);
  if(x<*m)
   u=m;
  else if(x==*m)
   return m-a;
  else
   l=m+1;
 }
 return -1;
}

上面给出的二分查找是迭代法实现,当然也可以用递归的方式实现。代码如下:

int binarysearch3(int a[],int l,int u,int x) 

int m=l+((u-l)>>1);
if(l<=u)
{
 if(x<a[m])
  return binarysearch3(a,l,m-1,x);
 else if(x==a[m])
  return m;
 else
  return binarysearch3(a,m+1,u,x);
}
return -1;

上述这些二分算法,若数组元素重复,返回的是重复元素的某一个元素。如果希望返回被查找元素第一次出现的位置,则需要修改代码。下面给出了一种解法:

int binarysearch4(int a[],int n,int x)
{
 int l,u,m;
 int flag=-1;
 l=0;u=n;
 while(l<u)
 {
  m=l+((u-l)>>1);
  if(x<a[m])
   u=m;
  else if(x==a[m])
   flag=u=m;
  else
   l=m+1;
 }
 return flag;
}

下面是《编程珠玑》上的解法:

int binarysearch4(int a[],int n,int x)
{
 int l,u,m;
 l=-1;u=n;
 while(l+1<u)
 {
  m=l+((u-l)>>1);
  if(a[m]<x)
   l=m;
  else
   u=m;
 }
 return (u>=n||a[u]!=x)?-1:u;
} 

至此二分算法的代码讨论结束,下面讨论一下程序的测试问题。《代码之美》有一章专门介绍二分查找算法的测试,非常漂亮。这里班门弄斧,简单给出几个测试用例。针对binarysearch1。测试程序如下:

#include <iostream>
#include <cassert>
#include <algorithm>
#include <ctime>
using namespace std; 

int calmid(int l,int u) { return l+((u-l)>>1); }
int binarysearch1(int a[],int n,int x); 

#define bs1 binarysearch1 

int main()
{
 long start,end;
 start=clock(); 

 int a[9]={-2147483648,-13,-10,-5,-3,0,1,400,2147483647};
 //中值下标计算的测试
 assert(calmid(0,1)==0);
 assert(calmid(0,2)==1);
 assert(calmid(1000000,2000000)==1500000);
 assert(calmid(2147483646,2147483647)==2147483646);
 assert(calmid(2147483645,2147483647)==2147483646); 

 //冒烟测试
 assert(bs1(a,9,0)==5);
 assert(bs1(a,9,1)==6);
 assert(bs1(a,9,2)==-1); 

 //边界测试
 assert(bs1(a,0,1)==-1);       //0个元素
 assert(bs1(a,1,-2147483648)==0);  //1个元素 成功
 assert(bs1(a,1,-2147483647)==-1);  //1个元素 失败 

 assert(bs1(a,9,-2147483648)==0);  //首个元素
 assert(bs1(a,9,-3)==4);       //中间元素
 assert(bs1(a,9,2147483647)==8);  //末尾元素 

 //自动化测试
 int b[10000];
 int i,j;
 for(i=0;i<10000;i++)
 {
  b[i]=i*10;
  for(j=0;j<=i;j++)
  {
   assert(bs1(b,i+1,j*10)==j);
   assert(bs1(b,i+1,j*10-5)==-1);
  }
 } 

 //自动化测试 引入随机数
 srand(time(0));
 for(i=0;i<10000;i++)
 {
  b[i]=rand()%1000000;
  sort(&b[0],&b[i]);
  for(j=0;j<=i;j++)
  {
   int x=rand();
   int k=bs1(b,i+1,x);
   if(k!=-1)
    assert(b[k]==x);
  }
 } 

 end=clock();
 cout<<(end-start)/1000.0<<'s'<<endl;
 return 0;
}

注意到数组的元素有正数,负数,零,最大值,最小值。通常会忘掉负数的测试,引入最大值和最小值,主要是为了边界测试。
       第一,测试了中值下标的计算。另外写了一个小函数,单独测试。考虑到内存可能放不下这么大的数组,因此只是模拟测试,并没有真正申请这么大的空间,但是对于中值下标的测试足够了。
       第二,冒烟测试。即做一些最基本的测试。测试通过后进行边界测试。
       第三,边界测试。这里有三种类型,一是针对数组元素个数,分别是0个,1个。二是针对元素位置,分别是首个元素,中间元素,末尾元素。三是针对元素值,有最大值,最小值,0等测试。
       第四,自动化测试。这里自动生成测试的数组,然后针对每个元素进行成功查找测试。
       第五,自动化测试,只不过数组的元素是随机值。
       第五,性能测试。这里相关代码没有列出。以上测试都通过时,可以修改查找算法,添加性能测试的代码。其实可以简单添加一个比较的计数器。返回值从原来的查找结果改为比较的计数器值即可。代码比较简单,就不列了。

Note:二分查找容易忽略的一个bug
对于二分查找算法,相信大家肯定不会陌生。算法从一个排好序的数组中找指定的元素,如果找到了返回该元素在数组中的索引,否则返回-1。下面给出了解法。

//a为排好序的数组,n为数组的大小,x为指定元素
int binarySearch(int a[], int n, int x)
{
 int left = 0, right = n-1, middle = 0;
 int tmp = 0;
 while(left <= right)
 {
   middle = (left + right)/2;
   tmp = a[middle];
   if(x < tmp) right = middle - 1;
   else if(x > tmp) left = middle + 1;
   else return middle;
 }
 return -1;
}

乍看没有错误,但是不幸的是,该程序存在一个bug。当数组极大时,(left+right)可能为负数,则数组下标溢出,程序崩溃。
解决的方案:将middle=(left+right)/2改为middle=left+(right-left)/2即可。即利用减法代替加法,从而消除上溢。
      参考自《代码之美》

(0)

相关推荐

  • C++二分查找算法实例

    本文实例为大家分享C++二分查找算法,通过改变边界位置来进行查找的方法,代码如下: #include <iostream> using namespace std; int search(int *p,int length,int key); int search1(int *p,int length,int key); int main() { cout << "Hello world!" << endl; int a[] = {1,2,3,4,5

  • C++二分查找(折半查找)算法实例详解

    本文实例讲述了C++二分查找(折半查找)算法.分享给大家供大家参考,具体如下: 二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好:其缺点是要求待查表为有序表,且插入删除困难. 因此,折半查找方法适用于不经常变动而查找频繁的有序列表. 二分查找思想 首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功: 否则利用中间位置记录将表分成前.后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表. 重复

  • C++ 中二分查找递归非递归实现并分析

    C++ 中二分查找递归非递归实现并分析 二分查找在有序数列的查找过程中算法复杂度低,并且效率很高.因此较为受我们追捧.其实二分查找算法,是一个很经典的算法.但是呢,又容易写错.因为总是考虑不全边界问题. 用非递归简单分析一下,在编写过程中,如果编写的是以下的代码: #include<iostream> #include<assert.h> using namespace std; int binaty_search(int* arr, size_t n, int x) { asse

  • C++实现旋转数组的二分查找

    本文实例讲述了C++实现旋转数组的二分查找方法,分享给大家供大家参考.具体方法如下: 题目要求: 旋转数组,如{3, 4, 5, 1, 2}是{1, 2, 3, 4, 5}的一个旋转,要求利用二分查找查找里面的数. 这是一道很有意思的题目,容易考虑不周全.这里给出如下解决方法: #include <iostream> using namespace std; int sequentialSearch(int *array, int size, int destValue) { int pos

  • C++二分查找在搜索引擎多文档求交的应用分析

    本文实例讲述了C++二分查找在搜索引擎多文档求交的应用.分享给大家供大家参考.具体如下: int search2(int array[], int n, int v) { int left, right, middle; left = 0, right = n - 1; while (left <= right) { middle = (left + right) / 2; if (array[middle] > v) { right = middle - 1; } else if (arra

  • 二分查找算法在C/C++程序中的应用示例

    二分查找算法的思想很简单,<编程珠玑>中的描述: 在一个包含t的数组内,二分查找通过对范围的跟综来解决问题.开始时,范围就是整个数组.通过将范围中间的元素与t比较并丢弃一半范围,范围就被缩小.这个过程一直持续,直到在t被发现,或者那个能够包含t的范围已成为空.         Donald Knuth在他的<Sorting and Searching>一书中指出,尽管第一个二分查找算法早在1946年就被发表,但第一个没有bug的二分查找算法却是在12年后才被发表出来.其中常见的一个

  • JavaScript使用二分查找算法在数组中查找数据的方法

    本文实例讲述了JavaScript使用二分查找算法在数组中查找数据的方法.分享给大家供大家参考.具体分析如下: 二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好:其缺点是要求待查表为有序表,且插入删除困难.因此,折半查找方法适用于不经常变动而查找频繁的有序列表.首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功:否则利用中间位置记录将表分成前.后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一

  • Python递归函数 二分查找算法实现解析

    一.初始递归 递归函数:在一个函数里在调用这个函数本身. 递归的最大深度:998 正如你们刚刚看到的,递归函数如果不受到外力的阻止会一直执行下去.但是我们之前已经说过关于函数调用的问题,每一次函数调用都会产生一个属于它自己的名称空间,如果一直调用下去,就会造成名称空间占用太多内存的问题,于是python为了杜绝此类现象,强制的将递归层数控制在了997(只要997!你买不了吃亏,买不了上当...). 拿什么来证明这个"998理论"呢?这里我们可以做一个实验: def foo(n): pr

  • 使用PHP实现二分查找算法代码分享

    第一种方法: [二分查找要求]:1.必须采用顺序存储结构 2.必须按关键字大小有序排列. [优缺点]折半查找法的优点是比较次数少,查找速度快,平均性能好;其缺点是要求待查表为有序表,且插入删除困难.因此,折半查找方法适用于不经常变动而查找频繁的有序列表. [算法思想]首先,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功:否则利用中间位置记录将表分成前.后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表. 复制代码 代码如下: <?

  • PHP二分查找算法示例【递归与非递归方法】

    本文实例讲述了PHP二分查找算法.分享给大家供大家参考,具体如下: binarySearch 二分查找采用的方法比较容易理解,以数组为例: ① 先取数组中间的值floor((low+top)/2), ② 然后通过与所需查找的数字进行比较,若比中间值大,则将首值替换为中间位置下一个位置,继续第一步的操作:若比中间值小,则将尾值替换为中间位置上一个位置,继续第一步操作 ③ 重复第二步操作直至找出目标数字 比如从1,3,9,23,54 中查找数字23, 首位置为0, 尾位置为4,中间位置就为2 值为9

  • python实现二分查找算法

    二分查找算法:简单的说,就是将一个数组先排序好,比如按照从小到大的顺序排列好,当给定一个数据,比如target,查找target在数组中的位置时,可以先找到数组中间的数array[middle]和target进行比较,当它比target小时,那么target一定是在数组的右边,反之,则target在数组的左边,比如它比target小,则下次就可以只比较[middle+1, end]的数,继续使用二分法,将它一分为二,直到找到target这个数返回或者数组全部遍历完成(target不在数组中) 优

  • Java实现二分查找算法实例分析

    本文实例讲述了Java实现二分查找算法.分享给大家供大家参考.具体如下: 1. 前提:二分查找的前提是需要查找的数组必须是已排序的,我们这里的实现默认为升序 2. 原理:将数组分为三部分,依次是中值(所谓的中值就是数组中间位置的那个值)前,中值,中值后:将要查找的值和数组的中值进行比较,若小于中值则在中值前面找,若大于中值则在中值后面找,等于中值时直接返回.然后依次是一个递归过程,将前半部分或者后半部分继续分解为三部分.可能描述得不是很清楚,若是不理解可以去网上找.从描述上就可以看出这个算法适合

  • Python实现二分查找算法实例

    本文实例讲述了Python实现二分查找算法的方法.分享给大家供大家参考.具体实现方法如下: #!/usr/bin/env python import sys def search2(a,m): low = 0 high = len(a) - 1 while(low <= high): mid = (low + high)/2 midval = a[mid] if midval < m: low = mid + 1 elif midval > m: high = mid - 1 else:

  • c# 二分查找算法

    折半搜索,也称二分查找算法.二分搜索,是一种在有序数组中查找某一特定元素的搜索算法. A 搜素过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜素过程结束: B 如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较. C 如果在某一步骤数组为空,则代表找不到.这种搜索算法每一次比较都使搜索范围缩小一半. 时间复杂度折半搜索每次把搜索区域减少一半,时间复杂度为. (n代表集合中元素的个数)空间复杂度 复制代码 代码如下: //

  • Python如何实现的二分查找算法

    先来看个用Python实现的二分查找算法实例 import sys def search2(a,m): low = 0 high = len(a) - 1 while(low <= high): mid = (low + high)/2 midval = a[mid] if midval < m: low = mid + 1 elif midval > m: high = mid - 1 else: print mid return mid print -1 return -1 if _

随机推荐