SQL Optimizer, Joinler için 3 farklı yöntem kullanmaktadır:
1. Nested Loop : Bir tablonun (outer table) tüm satırlarını döner ve her satır için diğer tablonun(inner table) satırlarını dönerek eşleştirmeye çalışır. Kayıt sayıları az olduğunda en iyi performansı verir. Right ve Full Outer Join bu yöntemi kullanmaz. Input tablonun büyüklüğü çarpı Output tablonun büyüklüğü maliyetle orantılıdır. Algoritma mantığı aşağıdaki gibidir:
for each row R1 in the outer table
for each row R2 in the inner table
if R1 joins with R2
return (R1, R2)
2. Merge Join : Aynı anda iki tablonun birer satırını okuyup karşılaştırarak eş zamanlı çalışır. Ancak iki tablonun join keylerinin sıralı olması zorunludur. “T1.a = T2.b” şeklinde bağlandıysa t1 in a, t2 nin de b kolonuna göre sıralı olması gerekmektedir. Tüm join tiplerini destekler. Kayıt sayısıyla maliyeti orantılıdır. Büyük kayıtlar için iyi sonuç verir. Input tablonun büyüklüğü maliyetle orantılıdır. Algoritma mantığı aşağıdaki gibidir:
get first row R1 from input 1
get first row R2 from input 2
while not at the end of either input
begin
if R1 joins with R2
begin
return (R1, R2)
get next row R2 from input 2
end
else if R1 < R2
get next row R1 from input 1
else
get next row R2 from input 2
end
3. Hash Join : Diğer iki çalışma şeklinden daha maliyetlidir. Sıralı olmayan büyük verilerde kullanılır. İlk tablonun tüm satırlarını okur, hash anahtarı yaratır ve bellekte yarattığı hash tabloya yazar. Sonra diğer tablonun satırlarını dönerek, her satır için hash anahtarı yaratır ve hash tablodaki değerlerle karşılaştırır. En maliyetli join türüdür. Algoritma mantığı aşağıdaki gibidir:
for each row R1 in the build table
begin
calculate hash value on R1 join key(s)
insert R1 into the appropriate hash bucket
end
for each row R2 in the probe table
begin
calculate hash value on R2 join key(s)
for each row R1 in the corresponding hash bucket
if R1 joins with R2
return (R1, R2)
end
View içerisindeki sorgularda INNER JOIN kullandığımızda, SQL optimizer “Hash Join” yapmaya karar verir. Büyük ve sıralı olmayan bir data olduğundan bu yöntemi seçer. Left join yaptığımızda ise Optimizer, Nested Loop yapmaya karar verir ve bu çok daha hızlı çalışmaktadır. Bilişim dünyasında her durumun tek bir doğrusu olmaması burada da geçerlidir. Çözüm olarak; indeksleri düzenleyerek dataları sıralı hale getirebilir veya uygulamanın ihtiyacına göre LEFT JOIN kullanabiliriz.
Serap PARLAK
Yorumlar
Yorum Gönder