JOIN Türüne Göre SQL Optimizer Çalışma Mantığı

SQL Optimizer, Joinler için 3 farklı yöntem kullanmaktadır:

1. Nested Loop : Bir tablonun (outer table) tüm satırlarını döner ve her satır için diğer tablonun(inner table) satırlarını dönerek eşleştirmeye çalışır. Kayıt sayıları az olduğunda en iyi performansı verir. Right ve Full Outer Join bu yöntemi kullanmaz. Input tablonun büyüklüğü çarpı Output tablonun büyüklüğü maliyetle orantılıdır. Algoritma mantığı aşağıdaki gibidir:

for each row R1 in the outer table
    for each row R2 in the inner table
        if R1 joins with R2
            return (R1, R2)

2. Merge Join : Aynı anda iki tablonun birer satırını okuyup karşılaştırarak eş zamanlı çalışır. Ancak iki tablonun join keylerinin sıralı olması zorunludur. “T1.a = T2.b” şeklinde bağlandıysa t1 in a, t2 nin de b kolonuna göre sıralı olması gerekmektedir. Tüm join tiplerini destekler. Kayıt sayısıyla maliyeti orantılıdır. Büyük kayıtlar için iyi sonuç verir. Input tablonun büyüklüğü maliyetle orantılıdır. Algoritma mantığı aşağıdaki gibidir:

get first row R1 from input 1
get first row R2 from input 2
while not at the end of either input
    begin
        if R1 joins with R2
            begin
                return (R1, R2)
                get next row R2 from input 2
            end
        else if R1 < R2
            get next row R1 from input 1
        else
            get next row R2 from input 2
    end

3. Hash Join : Diğer iki çalışma şeklinden daha maliyetlidir. Sıralı olmayan büyük verilerde kullanılır. İlk tablonun tüm satırlarını okur, hash anahtarı yaratır ve bellekte yarattığı hash tabloya yazar. Sonra diğer tablonun satırlarını dönerek, her satır için hash anahtarı yaratır ve hash tablodaki değerlerle karşılaştırır. En maliyetli join türüdür. Algoritma mantığı aşağıdaki gibidir:

for each row R1 in the build table
    begin
        calculate hash value on R1 join key(s)
        insert R1 into the appropriate hash bucket
    end
for each row R2 in the probe table
    begin
        calculate hash value on R2 join key(s)
        for each row R1 in the corresponding hash bucket
            if R1 joins with R2
                return (R1, R2)
    end

View içerisindeki sorgularda INNER JOIN kullandığımızda, SQL optimizer “Hash Join” yapmaya karar verir. Büyük ve sıralı olmayan bir data olduğundan bu yöntemi seçer. Left join yaptığımızda ise Optimizer, Nested Loop yapmaya karar verir ve bu çok daha hızlı çalışmaktadır. Bilişim dünyasında her durumun tek bir doğrusu olmaması burada da geçerlidir. Çözüm olarak; indeksleri düzenleyerek dataları sıralı hale getirebilir veya uygulamanın ihtiyacına göre LEFT JOIN kullanabiliriz.

Serap PARLAK

Univera Resmi Teknoloji Blog Sitesi

Bu Blogda Ara

JOIN Türüne Göre SQL Optimizer Çalışma Mantığı

Etiketler

Yorumlar

Yorum Gönder

Bu blogdaki popüler yayınlar

UML ve Modelleme – Bölüm 4 (Class (Sınıf) Diyagramları)

UML ve Modelleme – Bölüm 3 (Use Case Diyagramlar)

Yazılım Maliyet Tahmineleme Tecrübeleri