C语言实现排序算法之归并排序详解

排序算法中的归并排序(Merge Sort)是利用"归并"技术来进行排序。归并是指将若干个已排序的子文件合并成一个有序的文件。

一、实现原理:

1、算法基本思路

设两个有序的子文件(相当于输入堆)放在同一向量中相邻的位置上:R[low..m],R[m+1..high],先将它们合并到一个局部的暂存向量R1(相当于输出堆)中,待合并完成后将R1复制回R[low..high]中。

(1)合并过程

合并过程中,设置i,j和p三个指针,其初值分别指向这三个记录区的起始位置。合并时依次比较R[i]和R[j]的关键字,取关键字较小的记录复制到R1[p]中,然后将被复制记录的指针i或j加1,以及指向复制位置的指针p加1。
重复这一过程直至两个输入的子文件有一个已全部复制完毕(不妨称其为空),此时将另一非空的子文件中剩余记录依次复制到R1中即可。
最后,将结果赋值的R[]中。

(2)动态申请R1

实现时,R1是动态申请的,因为申请的空间可能很大,故须加入申请空间是否成功的处理。

二、3种方法实现:

算法1:归并函数都动态分配一个数组,两个有序数组合并成一个有序数组

//合并将两个有序序列([low,mid],[mid+1,high])合并
void Merge(int arr[],int low,int mid,int high)
{
  int i=low,j=mid+1,p=0;

  int *newarr = (int *)malloc((high-low+1)*sizeof(int));//用来暂存排序好的数据
  if(!newarr){
    printf("malloc error!\n");
    exit(1);
  }

  while(i<=mid && j<=high){    //以下过程很类似两个有序字符串合并成一个有序字符串
    if(arr[i] < arr[j])
      newarr[p++] = arr[i++];
    else
      newarr[p++] = arr[j++];
  }

  while(i<=mid)
    newarr[p++] = arr[i++];
  while(j<=high)
    newarr[p++] = arr[j++];

  for(i=low,p=0;p<(high-low+1);i++,p++)  //将结果复制到原数组当中
    arr[i] = newarr[p];
  free(newarr);
}

算法2:

程序开始处就动态分配一个大数组,避免每次都要创建很多小数组,释放内存的时候,不会立即释放。

有关assert()参见:http://www.jb51.net/article/39685.htm

/*
 * File: mergesort.c
 * Time: 2014-07-19 HJJ
 */
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

static void merge1(int array[], int tmp[], int lpos, int rpos, int rend);
static void msort1(int array[], int tmp[], int left, int right);

void merge_sort1(int array[], int n)
{
 assert(array!=NULL && n>1); //条件不满足,退出程序并打印错误语句。

 int *tmp = (int *)malloc(sizeof(int) * n);
 assert(tmp != NULL);
 int i;
 for (i = 0; i < n; i ++) {
 tmp[i] = array[i];
 }
 msort1(array, tmp, 0, n-1);

 free(tmp);
}

//递归的调用此函数,实现折半划分,只完成划分,不实现排序,最终返回array[]数组有序
static void msort1(int array[], int tmp[], int left, int right)
{
 assert(array!=NULL && tmp!=NULL);

 if (left == right)
 return;

 int center = (left + right) / 2;
 msort1(tmp, array, left, center);
 msort1(tmp, array, center+1, right);
 merge1(tmp, array, left, center+1, right);
}

//该函数实现,将array[]的左右两半排好序的数组,归并为tmp[],并排序
static void merge1(int array[], int tmp[], int lpos, int rpos, int rend)
{
 assert(array!=NULL && tmp!=NULL);

 int lend = rpos - 1;
 int tmp_pos = lpos;

 while (lpos<=lend && rpos<=rend) {
 if (array[lpos] <= array[rpos])
  tmp[tmp_pos++] = array[lpos++];
 else
  tmp[tmp_pos++] = array[rpos++];
 }

 while (lpos <= lend)
 tmp[tmp_pos++] = array[lpos++];
 while (rpos <= rend)
 tmp[tmp_pos++] = array[rpos++];
}

int main(int argc, char *argv[])
{
  int a[7] = {6, 5, 4, 3, 2, 1, 7};

  merge_sort1(a, 7);
  int i;
  for (i = 0; i < 7; i ++) {
    printf("%3d", a[i]);
  }
  printf("\n");

  return 0;
}

算法3:
程序开始处分配一个大的数组,只是每次用array[]将数据给tmp[]排好序后,最后再将tmp[]给array[]赋值,这样就能完成每次调用的时候,入口都一样。

void merge_sort1(int array[], int n)
{
 assert(array!=NULL && n>1); //条件不满足,退出程序并打印错误语句。

 int *tmp = (int *)malloc(sizeof(int) * n);
 assert(tmp != NULL);
 int i;
 for (i = 0; i < n; i ++) {
 tmp[i] = array[i];
 }
 msort1(array, tmp, 0, n-1);

 free(tmp);
}

//递归的调用此函数,实现折半划分,只完成划分,不实现排序,最终返回array[]数组有序
static void msort1(int array[], int tmp[], int left, int right)
{
 assert(array!=NULL && tmp!=NULL);

 if (left == right)
 return;

 int center = (left + right) / 2;
 msort1(tmp, array, left, center);
 msort1(tmp, array, center+1, right);
 merge(tmp, array, left, center+1, right);
}

实现方法二:

void merge(int array[],int tmp[],int lpos,int rpos,int rend)
{
  int i,leftend,num,tmppos;

  leftend = rpos - 1;
  num = rend - lpos + 1;
  tmppos = lpos;

  while(lpos <= leftend && rpos <= rend){
    if(array[lpos] <= array[rpos])
      tmp[tmppos++] = array[lpos++];
    else
      tmp[tmppos++] = array[rpos++];
  }

  while(lpos <= leftend)
    tmp[tmppos++] = array[lpos++];
  while(rpos <= rend)
    tmp[tmppos++] = array[rpos++];

  for(i = 0;i < num;i++,rend--)
    array[rend] = tmp[rend];
}

归并排序:将一个无序数组合并成一个有序数组

有两种实现方法:自底向上和自顶向下

1、 自底向上的方法(自底向上的归并排序算法虽然效率较高,但可读性较差。)

(1) 自底向上的基本思想:

自底向上的基本思想是:第1趟归并排序时,将待排序的文件R[1..n]看作是n个长度为1的有序子文件,将这些子文件两两归并,若n为偶数,则得到n/2个长度为2的有序子文件;若n为奇数,则最后一个子文件轮空(不参与归并)。故本趟归并完成后,前logn个有序子文件长度为2,但最后一个子文件长度仍为1;第2趟归并则是将第1趟归并所得到的logn个有序的子文件两两归并,如此反复,直到最后得到一个长度为n的有序文件为止。
上述的每次归并操作,均是将两个有序的子文件合并成一个有序的子文件,故称其为"二路归并排序"。类似地有k(k>2)路归并排序。

(2) 一趟归并算法
 分析:
在某趟归并中,设各子文件长度为length(最后一个子文件的长度可能小于length),则归并前R[1..n]中共有 个有序的子文件:R[1..length],R[length+1..2length],…

注意:

调用归并操作将相邻的一对子文件进行归并时,必须对子文件的个数可能是奇数、以及最后一个子文件的长度小于length这两种特殊情况进行特殊处理:

① 若子文件个数为奇数,则最后一个子文件无须和其它子文件归并(即本趟轮空);
② 若子文件个数为偶数,则要注意最后一对子文件中后一子文件的区间上界是n。

具体算法如下:

/*自底向上,这里就不写真正的代码了,从网上copy了*/
void MergePass(SeqList R,int length)
{ //对R[1..n]做一趟归并排序
  int i;
  for(i=1;i+2*length-1<=n;i=i+2*length)
    Merge(R,i,i+length-1,i+2*length-1);
  //归并长度为length的两个相邻子文件
  if(i+length-1<n) //尚有两个子文件,其中后一个长度小于length
    Merge(R,i,i+length-1,n); //归并最后两个子文件
//注意:若i≤n且i+length-1≥n时,则剩余一个子文件轮空,无须归并
} //MergePass

void MergeSort(SeqList R)
{//采用自底向上的方法,对R[1..n]进行二路归并排序
  int length;
  for(1ength=1;length<n;length*=2) //做 趟归并
    MergePass(R,length); //有序段长度≥n时终止
}

2、自顶向下的方法

采用分治法进行自顶向下的算法设计,形式更为简洁。

(1)分治法的三个步骤

设归并排序的当前区间是R[low..high],分治法的三个步骤是:

①分解:将当前区间一分为二,即求分裂点:mid = (low+high)/2;
②求解:递归地对两个子区间R[low..mid]和R[mid+1..high]进行归并排序;
③组合:将已排序的两个子区间R[low..mid]和R[mid+1..high]归并为一个有序的区间R[low..high]。

递归的终结条件:子区间长度为1(一个记录自然有序)。

具体算法:

void MSort(int arr[],int low,int high)
{
  if(low < high){
    int mid = (low+high)/2;
    MSort(arr,low,mid);   //左半区排序
    MSort(arr,mid+1,high); //右半区排序
    Merge(arr,low,mid,high);//左右半区合并
  }
}

三:分析

1、稳定性
归并排序是一种稳定的排序。

2、存储结构要求
可用顺序存储结构。也易于在链表上实现。

3、时间复杂度
对长度为n的文件,需进行lgn趟二路归并,每趟归并的时间为O(n),故其时间复杂度无论是在最好情况下还是在最坏情况下均是O(nlgn)。

4、空间复杂度
需要一个辅助向量来暂存两有序子文件归并的结果,故其辅助空间复杂度为O(n),显然它不是就地排序。

注意:
若用单链表做存储结构,很容易给出就地的归并排序。

(0)

相关推荐

  • C语言基本排序算法之桶式排序实例

    本文实例讲述了C语言基本排序算法之桶式排序.分享给大家供大家参考,具体如下: 桶式排序是对一个有n个整型元素的数组a[n],其中对任意i,0 <= a[i] <= m的特殊排序算法. 可以对 n==m, n != m分别处理.写代码时需要注意的的是a[i]是访问第i-1个元素,而非第i个. /************************************************************************************/ /* Bucket_Sort.h

  • C语言排序算法之冒泡排序实现方法【改进版】

    本文实例讲述了C语言排序算法之冒泡排序实现方法.分享给大家供大家参考,具体如下: 冒泡排序和改进的冒泡排序 /*------------------------------------------------------------------------------------------- Bubble_sort.h 冒泡排序: 时间复杂度为O(N^2) 改进的冒泡排序: 时间复杂度仍为O(N^2) 一般的冒泡排序方法有可能会在已经排好序的情况下继续比较,改进的冒泡排序 设置了一个哨兵fla

  • C语言基本排序算法之shell排序实例

    本文实例讲述了C语言基本排序算法之shell排序.分享给大家供大家参考,具体如下: shell排序是对直接插入方法的改进方法. /*------------------------------------------------------------------------------------- Shell_sort.h shell排序是对直接插入方法的改进,它并不是对相邻元素进行比较,而是对一定间隔的元素比较. 选择增量序列的几种方法:(为方便,本例采用第一种增量序列) 1. h[1]=

  • c语言快速排序算法示例代码分享

    步骤为:1.从数列中挑出一个元素,称为 "基准"(pivot);2.重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边).在这个分区退出之后,该基准就处于数列的中间位置.这个称为分区(partition)操作.3.递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序.递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了.虽然一直递归下去,但是这个算法总会退出,因为在每次的迭代(iterat

  • C语言 实现归并排序算法

    C语言 实现归并排序算法 归并排序(Merge sort)是创建在归并操作上的一种有效的排序算法.该算法是采用分治法(Divide and Conquer)的一个非常典型的应用. 一个归并排序的例子:对一个随机点的链表进行排序 算法描述 归并操作的过程如下: 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列 设定两个指针,最初位置分别为两个已经排序序列的起始位置 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置 重复步骤3直到某一指针到达序列尾

  • C语言实现基于最大堆和最小堆的堆排序算法示例

    堆定义 堆实际上是一棵完全二叉树,其任何一非叶节点满足性质: Key[i]<=key[2i+1]&&Key[i]<=key[2i+2](小顶堆)或者:Key[i]>=Key[2i+1]&&key>=key[2i+2](大顶堆) 即任何一非叶节点的关键字不大于或者不小于其左右孩子节点的关键字. 堆排序的思想 利用大顶堆(小顶堆)堆顶记录的是最大关键字(最小关键字)这一特性,使得每次从无序中选择最大记录(最小记录)变得简单. 最大堆:所有节点的子节点比其

  • C语言 冒泡排序算法详解及实例

    C语言 冒泡排序算法 冒泡排序(Bubble Sort)是一种简单的排序算法.它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来.走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成.这个算法的名字由来是因为越小的元素会经由交换慢慢"浮"到数列的顶端. 冒泡排序对n个项目需要O(n2)的比较次数,且可以原地排序.尽管这个算法是最简单了解和实作的排序算法之一,但它对于少数元素之外的数列排序是很没有效率的. 冒泡排序是与插入排序拥有相等的执

  • C语言基本排序算法之插入排序与直接选择排序实现方法

    本文实例讲述了C语言基本排序算法之插入排序与直接选择排序实现方法.分享给大家供大家参考,具体如下: 声明待排序元素类型 /*-------------------------- typedef.h 方便修改待排序元素类型 -------------------------------------*/ #ifndef TYPEDEF_H #define TYPEDEF_H typedef int T; #endif 插入排序: /*---------------------------------

  • 桶排序算法的理解及C语言版代码示例

    理解: 桶排序是计数排序的变种,把计数排序中相邻的m个"小桶"放到一个"大桶"中,在分完桶后,对每个桶进行排序(一般用快排),然后合并成最后的结果. 基本思想: 桶排序假设序列由一个随机过程产生,该过程将元素均匀而独立地分布在区间[0,1)上.我们把区间[0,1)划分成n个相同大小的子区间,称为桶.将n个记录分布到各个桶中去.如果有多于一个记录分到同一个桶中,需要进行桶内排序.最后依次把各个桶中的记录列出来记得到有序序列. 效率分析: 桶排序的平均时间复杂度为线性的

  • 常用排序算法的C语言版实现示例整理

    所谓排序,就是要整理文件中的记录,使之按关键字递增(或递减)次序排列起来.其确切定义如下: 输入:n个记录R1,R2,-,Rn,其相应的关键字分别为K1,K2,-,Kn. 输出:Ril,Ri2,-,Rin,使得Ki1≤Ki2≤-≤Kin.(或Ki1≥Ki2≥-≥Kin).     排序的时间开销可用算法执行中的数据比较次数与数据移动次数来衡量.基本的排序算法有如下几种:交换排序(冒泡排序.快速排序).选择排序(直接选择排序.堆排序).插入排序(直接插入排序.希尔排序).归并排序.分配排序(基数排

随机推荐