Ana içeriğe atla

Veri Madenciliği

Bilgi sitemleri üzerinden üretilen veri miktarının büyük  artış  gösterdiğini ve  firmaların veritabanlarının  boyutlarının  terabytelar seviyesine ulaştığını  görmekteyiz.  Veritabanlarındaki teknolojik gelişmeler ve hacimlerindeki olağanüstü artış, firmaları,  bu verilerden nasıl faydalanılacağını ve bu  verilerin  nasıl  anlamlı hale  getirileceği  sorunuyla  karşı  karşıya  bırakmıştır.
Bilgisayar  sistemleri  ile  üretilen  bu  veriler tek başlarına  değersizdirler.  Ancak belli  bir amaç  doğrultusunda  işlendikleri  zaman  anlamlı  hale  gelirler. İşte ham  veriyi  bilgiye veya anlamlı  hale  dönüştürme  işini veri madenciliği ile yapabiliriz.
image

Veri madenciliği sürecinde; kümeleme, veri özetleme, sınıflama  kurallarının  öğrenilmesi, bağımlılık  ağlarının  bulunması, değişkenlik  analizi ve anomali tespiti gibi  farklı birçok teknik  kullanılmaktadır.
Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Başka bir deyişle, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli olan yapıların yarı otomatik olarak keşfedilmesidir. Amaç, daha önceden fark edilmemiş veri desenlerini tespit edebilmektir.
Veri madenciliği kendi başına  bir  çözüm değil, çözüme  ulaşmak  için  verilecek karar sürecini destekleyen, problemi  çözmek  için gerekli bilgileri sağlamaya  yarayan bir araçtır. Veri madenciliği; analistlere, iş  yapma  aşamasında  oluşan  veriler arasındaki şablonları ve ilişkileri  bulmaları  konusunda  yardım etmektedir. 
Veri Madenciliğinin kullanım amaçlarını aşağıdaki gibi sıralayabiliriz;
  • Veri ambarında depolanmış verilerden anlamlı bilgi çıkartma,
  • Çok büyük miktardaki veriden yeni ve işimiz için gerekli olan anlamlı bilgi üretme,
  • Verinin özelliklerinden yararlanarak eğilimlerini anlama,
  • Geleceğe yönelik tahminlerde bulunarak bilgiyi gelecekteki müşteri ilişkilerini yönlendirmek amacıyla değerlendirme,
Günümüzde  veri madenciliğinin başlıca  ilgi alanları  olarak  aşağıdakiler  sayılabilir;
  • Müşteri sınıflandırması,
  • Müşterilerin  demografik  özellikleri arasındaki bağlantıların  kurulması,
  • Çeşitli pazarlama kampanyaları,
  • Mevcut müşterilerin  elde  tutulması  için geliştirilecek  pazarlama  stratejilerinin  oluşturulması,
  • Pazar sepeti analizi
Mustafa ERŞAHİN

Yorumlar

Bu blogdaki popüler yayınlar

UML ve Modelleme – Bölüm 3 (Use Case Diyagramlar)

Önceki iki makalemizde (1, 2) UML’e genel olarak değinip ve modellemede kullanacağımız dokuz diyagram hakkında bilgiler vermiştik. Bu makalemizde Use Case diyagramından detaylı bahsedeceğiz. Öncelikle, genel Use case diyagramının tanımını hatırlayalım. “Bir kullanıcı ve bir sistem arasındaki etkileşimi anlatan senaryo topluluğudur.” Ivar Jacobson Senaryo tanımı için der ki:
“Aktörle sistem arasında gerçekleştirilen, sonucunda aktöre farkedilir getirisi/ faydası oluşan etkileşimli diyalogdur. ” UML Use Case Diyagramları  sistemin işlevselliğini açıklamak amacıyla kullanılır. Sistemin birbirinden ayrı özelliklerinin detaylarını göstermekten ziyade, Use Case Diyagramlar, tüm mevcut işlevselliği göstermek için kullanılabilir. Buradaki en önemli noktalardan biri,   Use Case Diyagramlar temelde sequence diyagram ve akış diyagramlarından farklıdır. Use Case diyagramlar dört ana elemandan oluşmaktadır. Aktörler, Sistem (Proje kapsamını belirtir), Use Caseler ve bunlar arasındaki ilişkiler. Şekil…

UML ve Modelleme – Bölüm 4 (Class (Sınıf) Diyagramları)

Bir önceki makalemizde UML modellemede kullanılan ilk diyagram olan Use Case diyagramını incelemiştik. Bu makalemizde nesne tabanlı programlamada kullanılan sınıflar ve sınıfların arasındaki ilişkileri modelleyebileceğimiz diyagramlar olan Class(Sınıf) diyagramlarını inceleyeceğiz. UML’de sınıflar, nesne tabanlı programlama mantığı ile tasarlanmıştır. Sınıf diyagramının amacı bir model içerisinde sınıfların tasvir edilmesidir. Nesne tabanlı uygulamada, sınıfların kendi özellikleri (üye değişkenler), işlevleri (üye fonksiyonlar) ve diğer sınıflarla ilişkileri bulunmaktadır. UML’de sınıf diyagramlarının genel gösterimi aşağıdaki gibidir. Şekil 1. Class Diyagram Şekil1’de görüldüğü üzere bir dikdörtgeni 3 parçaya bölüyoruz. En üst bölüm sınıf adını, orta kısım özellik listesini (üye değişkenler) ve en son kısım, işlev listesini (üye fonksiyonlar) göstermektedir. Çoğu diyagramlarda alt iki bölüm çıkarılır. Genelde tüm özellik ve işlevler gösterilmemektedir. Amaç, diyagramın sadece belirli k…

Cluster ve clustering nedir? Cluster oluşturmanın faydaları nelerdir? (Bölüm I)

Cluster, basit anlamda benzer bir amaç için belirli bir konfigürasyon yapılarak aynı görevi birlikte ya da yedekli çalışmasını sağlayan servistir. Cluster farklı amaçlarla oluşturulabilir fakat son kullanıcı tarafından her zaman tek bir bilgisayar gibi gözükecektir. Bir cluster oluşturmak için en azından iki adet sunucuya ihtiyaç vardır ve bir cluster içindeki her bir sunucu “node” olarak adlandırılır. İhtiyaç olan hizmete göre çeşitli sayıda nodelar bir araya gelerek clusterları oluşturmaktadır. Bir cluster oluşturmak için gerekli sebepler daha fazla performans ihtiyacı, yüksek erişilebilirlik (high availability) ya da her ikisi birlikte olabilir. Şimdi cluster çeşitlerini çok fazla ayrıntıya girmeden biraz daha yakından inceleyelim. Yüksek erişilebilirlik (High-availability) clusterlarıBu tip cluster yapısında öncelik erişilebilirliği arttırmadır. Bunu tek bir sunucunun görevini herhangi bir donanım yada yazılım problemi oluştuğunda diğer bir sunucunun otomatik olarak devralması olara…