1.排序的概念和相关知识
排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。
内部排序:数据元素全部放在内存中的排序。
外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序(在硬盘中)。
注:下列排序均为升序;
排序算法---插入排序---希尔排序:
排序思想:先将数组分为几个等大的数组,对其分别排序,使这些子数组有序,然后再对整个数组进行排序,使之有序;
步骤:1.预排序:先分数组,用插入排序对其进行排序,使得每个子数组有序(每次排完后可以再减小组数再预排)
2.直接插入排序:对上面预排好的数组进行直接插入排序;
注意:每个子数组的相邻元素中间有n个元素,组数为" 数组总原元素个数 / (n + 1),比如下面第一幅图,红色组中间有3个元素再加1,就是其间隔' 4' "
过程图示:
一、
这里对红绿蓝黑四组数据排序。
二、
在前四组排好后,在把数组分为两组,再进行一次预排;
三、
这时候数组已经非常接近有序了,只要再来一次整体的插入排序就可以使其有序;
四、
这是排好的数组。
如果还不清楚,可以看下面的动图:
下面对希尔排序的一些细节进行介绍
1. 如何确定组数,也就是确定每组相邻元素之间的间隔(也就是两个元素之间的中间元素个数加一)?
这个官方并没有明确规定,但通用的一般是:第一次gap() = "数组总数 / 3 + 1" 或者是 gap = " 数组总数 / 2",每次循环就 除3加1 或 除2 直到gap == 1(这里就是进行多次预排);当gap == 1 时,就是直接插入排序。
2.希尔排序的时间复杂度 && 空间复杂度?
由于gap 的不确定,导致希尔排序的时间复杂度难以计算,由于涉及一些复杂的数学问题,基本很难算出一个统一结果,所以我们姑且把它当成O(N ^ 1.3)(现在有许多的答案,但基本就在N ^ 1.3附近);由于希尔排序没有额外开辟空间,所以空间复杂度为O(1);
3.稳定性?
因为在希尔排序中,相同的数可能分在不同的组,在预排时就会把原有的顺序打乱,所以其实没有办法让它保证稳定。
4.相对于其他排序的效率?
毫无疑问希尔排序是比时间复杂度为O(N ^ 2)的排序效率高的,比如选择,插入,冒泡……等
但相对于时间复杂度为O(N * logN) 的排序来说,其实希尔排序的效率会略差一点,但总体差别不大。
代码如下:(建议读者从单趟开始写,比较容易控制)
void ShellSort(int* a, int numsize) { int gap = numsize; //gap大于1是预排序,目的是为了让其接近有序; //gap == 1 是直接插入排序,目的是为了让其完全有序; while(gap > 1) { gap = gap / 3 + 1; for (int i = 0; i < numsize - gap; i++)//这里i < numsize - gap 是为了防止下面tmp越界 { int end = i; int tmp = a[end + gap]; while (end >= 0)//这里过程其实跟插入排序没什么区别,注意细节即可; { if (tmp < a[end]) { a[end + gap] = a[end]; end -= gap; } else { break; } } a[end + gap] = tmp; } } }
如果有不对之处,还望各位读者指正,谢谢。