Ana içeriğe atla

JOIN Türüne Göre SQL Optimizer Çalışma Mantığı

SQL Optimizer, Joinler için 3 farklı yöntem kullanmaktadır:
1. Nested Loop : Bir tablonun (outer table) tüm satırlarını döner ve her satır için diğer tablonun(inner table) satırlarını dönerek eşleştirmeye çalışır. Kayıt sayıları az olduğunda en iyi performansı verir. Right ve Full Outer Join bu yöntemi kullanmaz. Input tablonun büyüklüğü çarpı Output tablonun büyüklüğü maliyetle orantılıdır. Algoritma mantığı aşağıdaki gibidir:
for each row R1 in the outer table
    for each row R2 in the inner table
        if R1 joins with R2
            return (R1, R2)
2. Merge Join : Aynı anda iki tablonun birer satırını okuyup karşılaştırarak eş zamanlı çalışır. Ancak iki tablonun join keylerinin sıralı olması zorunludur. “T1.a = T2.b” şeklinde bağlandıysa t1 in a, t2 nin de b kolonuna göre sıralı olması gerekmektedir. Tüm join tiplerini destekler. Kayıt sayısıyla maliyeti orantılıdır. Büyük kayıtlar için iyi sonuç verir. Input tablonun büyüklüğü maliyetle orantılıdır. Algoritma mantığı aşağıdaki gibidir:

get first row R1 from input 1
get first row R2 from input 2
while not at the end of either input
    begin
        if R1 joins with R2
            begin
                return (R1, R2)
                get next row R2 from input 2
            end
        else if R1 < R2
            get next row R1 from input 1
        else
            get next row R2 from input 2
    end
3. Hash Join : Diğer iki çalışma şeklinden daha maliyetlidir. Sıralı olmayan büyük verilerde kullanılır. İlk tablonun tüm satırlarını okur, hash anahtarı yaratır ve bellekte yarattığı hash tabloya yazar. Sonra diğer tablonun satırlarını dönerek, her satır için hash anahtarı yaratır ve hash tablodaki değerlerle karşılaştırır. En maliyetli join türüdür. Algoritma mantığı aşağıdaki gibidir:
for each row R1 in the build table
    begin
        calculate hash value on R1 join key(s)
        insert R1 into the appropriate hash bucket
    end
for each row R2 in the probe table
    begin
        calculate hash value on R2 join key(s)
        for each row R1 in the corresponding hash bucket
            if R1 joins with R2
                return (R1, R2)
    end
View içerisindeki sorgularda INNER JOIN kullandığımızda, SQL optimizer “Hash Join” yapmaya karar verir. Büyük ve sıralı olmayan bir data olduğundan bu yöntemi seçer. Left join yaptığımızda ise Optimizer, Nested Loop yapmaya karar verir ve bu çok daha hızlı çalışmaktadır. Bilişim dünyasında her durumun tek bir doğrusu olmaması burada da geçerlidir. Çözüm olarak;  indeksleri düzenleyerek dataları sıralı hale getirebilir veya uygulamanın ihtiyacına göre LEFT JOIN kullanabiliriz.
Serap PARLAK

Yorumlar

Bu blogdaki popüler yayınlar

UML ve Modelleme – Bölüm 3 (Use Case Diyagramlar)

Önceki iki makalemizde (1, 2) UML’e genel olarak değinip ve modellemede kullanacağımız dokuz diyagram hakkında bilgiler vermiştik. Bu makalemizde Use Case diyagramından detaylı bahsedeceğiz. Öncelikle, genel Use case diyagramının tanımını hatırlayalım. “Bir kullanıcı ve bir sistem arasındaki etkileşimi anlatan senaryo topluluğudur.” Ivar Jacobson Senaryo tanımı için der ki:
“Aktörle sistem arasında gerçekleştirilen, sonucunda aktöre farkedilir getirisi/ faydası oluşan etkileşimli diyalogdur. ” UML Use Case Diyagramları  sistemin işlevselliğini açıklamak amacıyla kullanılır. Sistemin birbirinden ayrı özelliklerinin detaylarını göstermekten ziyade, Use Case Diyagramlar, tüm mevcut işlevselliği göstermek için kullanılabilir. Buradaki en önemli noktalardan biri,   Use Case Diyagramlar temelde sequence diyagram ve akış diyagramlarından farklıdır. Use Case diyagramlar dört ana elemandan oluşmaktadır. Aktörler, Sistem (Proje kapsamını belirtir), Use Caseler ve bunlar arasındaki ilişkiler. Şekil…

UML ve Modelleme – Bölüm 4 (Class (Sınıf) Diyagramları)

Bir önceki makalemizde UML modellemede kullanılan ilk diyagram olan Use Case diyagramını incelemiştik. Bu makalemizde nesne tabanlı programlamada kullanılan sınıflar ve sınıfların arasındaki ilişkileri modelleyebileceğimiz diyagramlar olan Class(Sınıf) diyagramlarını inceleyeceğiz. UML’de sınıflar, nesne tabanlı programlama mantığı ile tasarlanmıştır. Sınıf diyagramının amacı bir model içerisinde sınıfların tasvir edilmesidir. Nesne tabanlı uygulamada, sınıfların kendi özellikleri (üye değişkenler), işlevleri (üye fonksiyonlar) ve diğer sınıflarla ilişkileri bulunmaktadır. UML’de sınıf diyagramlarının genel gösterimi aşağıdaki gibidir. Şekil 1. Class Diyagram Şekil1’de görüldüğü üzere bir dikdörtgeni 3 parçaya bölüyoruz. En üst bölüm sınıf adını, orta kısım özellik listesini (üye değişkenler) ve en son kısım, işlev listesini (üye fonksiyonlar) göstermektedir. Çoğu diyagramlarda alt iki bölüm çıkarılır. Genelde tüm özellik ve işlevler gösterilmemektedir. Amaç, diyagramın sadece belirli k…

Cluster ve clustering nedir? Cluster oluşturmanın faydaları nelerdir? (Bölüm I)

Cluster, basit anlamda benzer bir amaç için belirli bir konfigürasyon yapılarak aynı görevi birlikte ya da yedekli çalışmasını sağlayan servistir. Cluster farklı amaçlarla oluşturulabilir fakat son kullanıcı tarafından her zaman tek bir bilgisayar gibi gözükecektir. Bir cluster oluşturmak için en azından iki adet sunucuya ihtiyaç vardır ve bir cluster içindeki her bir sunucu “node” olarak adlandırılır. İhtiyaç olan hizmete göre çeşitli sayıda nodelar bir araya gelerek clusterları oluşturmaktadır. Bir cluster oluşturmak için gerekli sebepler daha fazla performans ihtiyacı, yüksek erişilebilirlik (high availability) ya da her ikisi birlikte olabilir. Şimdi cluster çeşitlerini çok fazla ayrıntıya girmeden biraz daha yakından inceleyelim. Yüksek erişilebilirlik (High-availability) clusterlarıBu tip cluster yapısında öncelik erişilebilirliği arttırmadır. Bunu tek bir sunucunun görevini herhangi bir donanım yada yazılım problemi oluştuğunda diğer bir sunucunun otomatik olarak devralması olara…