مرتبسازی درجی
مرتبساز درجی (Insertion Sort) یک الگوریتم مرتبسازی ساده بر مبنای مقایسه است. این الگوریتم برای تعداد دادههای زیاد، کارآمد نیست و در این موارد، الگوریتمهای بهتری مثل مرتبساز سریع، مرتبساز ادغامی و مرتبساز پشته وجود دارد.
مزایا
این الگوریتم، بعضی مزایا هم دارد:
- پیادهسازی آن راحت است.
- برای دادههای کم، کارآمدتر است.
- برای مرتبسازی مجموعه دادههای تقریباً مرتب شده، کارآمد است: اگر تعداد وارونگیها، d باشد، این الگوریتم دارای زمان اجرای (O(n + d خواهد بود.
- در عمل از بسیاری از الگوریتمهای (O(n۲ مثل مرتبساز انتخابی یا مرتبساز حبابی، بهتر عمل میکند: متوسط زمان اجرای آن هم، (O(n۲ است که در بهترین حالت، خطی است.
- پایدار است. (ترتیب نسبی عناصر یکسان را حفظ میکند)
- درجا است. (حافظه اضافی ثابت، (O(۱ لازم دارد)
- یک الگوریتم برخط است. یعنی یک لیست را به محض دریافت کردن، مرتب میکند.
الگوریتم
این الگوریتم به این صورت عمل میکند که تمام عناصر لیست را یکی یکی برمیدارد و آن را در موقعیت مناسب در بخش مرتب شده قرار میدهد. انتخاب عنصر مورد نظر، اختیاری است و میتواند توسط هر الگوریتم انتخابی، انتخاب شود. مرتبسازی درجی به صورت درجا عمل میکند. نتیجه عمل بعد از k مرحله، حاوی k عنصر انتخاب شده به صورت مرتب شدهاست.
معمولترین نسخه از این الگوریتم که روی آرایهها عمل میکند، به این صورت است:
- فرض کنید یک تابع به اسم Insert داریم که داده را در بخش مرتب شده در ابتدای آرایه درج میکند. این تابع با شروع از انتهای سری شروع به کار میکند و هر عنصر را به سمت راست منتقل میکند تا وقتی که جای مناسب برای عنصر جدید پیدا شود. این تابع این اثر جانبی را دارد که عنصر دقیقاً بعد از بخش مرتب شده را رونویسی میکند.
- برای اعمال مرتبساز درجی، از انتهای سمت چپ آرایه شروع میکنیم و با صدا زدن تابع insert، هر عنصر را به موقعیت درستش میبریم. آن بخشی که عنصر فعلی را در آن میکنیم، در ابتدای آرایه و در اندیسهایی است که آنها را قبلاً آزمایش کردهایم. هر بار صدا زدن تابع insert، یک عنصر را رونویسی میکند، اما این مسئله مشکلی ایجاد نمیکند، زیرا این داده، همانی است که الان در حال درج آن هستیم.
یک شبهکد ساده از الگوریتم به صورت زیر است. در اینجا آرایهها از صفر شروع میشوند و حلقه for هم دارای هر دو کران بالا و پایین است (مثل پاسکال):
insertionSort(array A)
begin
for i = 1 to length[A]-1 do
begin
value := A[i]
j := i-1
while j >= 0 and A[j] > value do
begin
A[j + 1] = A[j]
j := j-1
end;
A[j+1] := value
end;
end;
ورودیهای خوب و بد
بهترین حالت زمانی است که آرایه از قبل مرتب شده باشد. در این حالت زمان اجرای الگوریتم از (O(n است: در هر مرحله اولین عنصر باقیمانده از لیست اولیه فقط با آخرین عنصر لیست مرتب شده مقایسه میشود. این حالت بدترین حالت برای مرتبساز سریع (غیرتصادفی و با پیادهسازی ضعیف) است که زمان (O(n۲ صرف میکند. بدترین حالت این الگوریتم، زمانی است که آرایه به صورت معکوس مرتب شده باشد. در این حالت هر اجرای حلقه داخلی، مجبور است که تمام بخش مرتب شده را بررسی کرده و انتقال دهد. در این زمان اجرای الگوریتم، مثل حالت متوسط، دارای زمان اجرای (O(n۲ است که باعث میشود استفاده از این الگوریتم برای مرتبسازی تعداد دادههای زیاد، غیرعملی شود. گرچه حلقه داخلی مرتبساز درجی، خیلی سریع است و این الگوریتم را به یکی از سریعترین الگوریتمهای مرتبسازی، برای تعداد دادههای کم (معمولاً کمتر از ۱۰)، تبدیل میکند.
مقایسه با دیگر الگوریتمهای مرتبسازی
مرتبسازی درجی بسیار شبیه به مرتبسازی انتخابی است. مانند مرتبسازی انتخابی، پس از k مرحله در آرایه، k عنصر اول در حالت مرتب شده قرار دارند. برای مرتبسازی انتخابی، آن عناصر، کوچترین k عنصر موجود در لیست هستند در حالیکه در مرتبسازی درجی، آن عناصرk عنصر اول از آرایه مرتب نشده هستند. مزیت مرتبسازی درجی این است که برای تشخیص مکان درست عنصر۱+kام، فقط عناصر مورد نیاز را بررسی میکند؛ درحالیکه مرتبسازی انتخابی باید همه عناصر باقیمانده را بررسی کند تا کوچکترین آنها را پیدا کند. محاسبات نشان میدهد که مرتبسازی درجی معمولاً نصف تعداد مقایسههای مرتبسازی انتخابی را انجام میدهد. فرض کنید که اولویت عنصر ۱+kام تصادفی است. حال مرتبسازی درجی بهطور متوسط باید نیمی از k عنصر مرتب شده را بررسی کند تا محل عنصر جدید را پیدا کند، درحالیکه مرتبسازی انتخابی همیشه نیازمند بررسی همه عناصر مرتب نشده است. اگر آرایه ورودی بهطور معکوس مرتب شده باشد، مرتبسازی درجی به اندازه مرتبسازی انتخابی مقایسه انجام میدهد. اما اگر آرایه ورودی واقعاً مرتب شده است، مرتبسازی درجی ۱-n مقایسه کمتر انجام میدهد، بنابراین وقتی آرایه ورودی «تقریباً مرتب شده» باشد، مرتبسازی درجی بهینه تر عمل میکند. درحالیکه مرتبسازی درجی معمولاً تعداد مقایسههای کمتری از مرتبسازی انتخابی انجام میدهد، نیازمند نوشتنهای بیشتر است چون حلقه داخلی ممکن است به جابجا کردن بخشهای زیادی از بخش مرتب شده نیاز داشته باشد. در حالت کلی، مرتبسازی درجی در آرایه O(n۲) بار عمل نوشتن انجام میدهد؛ درحالیکه مرتبسازی انتخابی تنها (O(n بار مینویسد. به همین دلیل مرتبسازی انتخابی در مواردی که نوشتن در حافظه نیازمند هزینه زیادی باشد، سریعتر عمل میکند مانند نوشتن در EEPROM یا حافظه فلش. برخی الگوریتمهای تقسیم و حل مثل مرتبسازی سریع یا مرتبسازی ادغام با تقسیم کردن لیست به صورت بازگشتی به زیر لیستهای مرتب شده، عمل مرتبسازی را انجام میدهند. در عمل یک راه بهینهسازی برای این الگوریتمها این است که مرتبسازی درجی را برای مرتب کردن زیر لیستهای کوچک استفاده کنیم که در کل موجب سریعتر شدن عملیات میشود. سایز لیستی که برای آن، مرتبسازی درجی مزیت بیشتری از سایر انواع مرتبسازیها دارد، با توجه به پیادهسازی و محیط تغییر میکند اما معمولاً بین هشت تا بیست عنصر است.
نسخههای مختلف
D.L. Shell این الگوریتم را بهبود بخشید که نسخه بهبود داده شده آن، مرتبسازی شل نامیده میشود. این الگوریتم مرتبسازی، عناصر را با فاصلهای که در هر مرحله کم میشود، مقایسه میکند. مرتبسازی شل بهطور قابل توجهی مراحل اجرا را در کار عملی ارتقا داده است که در دو نسخه مختلف، با زمان اجرای O(n۳/۲) و O(n۴/۳) عمل میکند. اگر هزینه مقایسهها از هزینه جابجایی بیشتر باشد، مانند حالتی که لیست ورودی مرتب شده باشد، استفاده کردن از مرتبسازی درجی دودویی عملکرد بهتری خواهد داشت. مرتبسازی درجی دودویی از جستجوی دودویی استفاده میکند تا محل مناسب برای قرار دادن عنصر جدید را پیدا کند و بنابراین در بدترین حالت مقایسه انجام میدهد که Θ(n log n) است. الگوریتم در حالت میانگین بخاطر مجموعه جابجاییهایی که برای هر درج لازم است، زمان اجرای Θ(n۲) دارد. در بهترین حالت نیز زمان اجرای آن طولانی تر Ω(n log n) نیست. برای پیشگیری کردن از مجموعهای از جابجاییها برای هر درج، ورودی میتواند در یک لیست پیوندی مرتب شود که امکان میدهد عناصر در زمان ثابت درج یا حذف شوند. البته اجرای جستجوی دودویی در یک لیست پیوندی غیرممکن است چون یک لیست پیوندی دسترسی تصادفی به عناصر را پشتیبانی نمیکند؛ بنابراین زمان اجرا برای جستجو O(n۲) است. اگر یک ساختمان دادههای پیچیده تر مانند هرم استفاده شود، زمان مورد استفاده برای جستجو و درج بهطور قابل ملاحظهای کاهش مییابد.
پیادهسازی مرتبسازی درجی
الگوریتم مرتبسازی درجی به زبان برنامهنویسی C برای مرتب کردن عناصر آرایهای از اعداد صحیح به صورت زیر پیادهسازی میشود:
void insertion_sort(int *arr, int n)
{
int i, j, t;
for(i=1; i<n; i++)
{
t = arr[i];
for(j=i; j>0; j--)
{
if(t>=arr[j-1])
break;
arr[j] = arr[j-1];
}
arr[j] = t;
}
}