Ana içeriğe atla

XML’in Özellikleri ve Yaklaşımlar

İlk yazımızda, XML’in tarihteki varoluş sürecinden bahsetmiştik. Bu yazımızla birlikte yavaş yavaş teknoloji detaylarına girmeye başlıyoruz.
1. XML yapısal bir text formatına sahiptir
Avantajları:
Bu doğal özelliği sayesinde, içerik bilgisinin yanı sıra, içeriğin ne anlam taşıdığını (metadatasını) yapısal bir formatta tutar. Örneğin bir kitabı tanımlayan elemanları; başlığı, yazarı, bölümleri, bölüm yazıları ve kataloğudur. Bir bölüm yazısını tanımlayan elemanlar ise paragrafları, satırları ve dipnotlarıdır. Kitabı bu şekilde yapısal tanımlayan bir döküman yaratmak, hem makine hem de insan tarafından okunabilirlik sağlar. Eğer yazardan, kitabın katalog bölümünde bahsedilirse, yapısallık bozulmuş olur.
Çoğu metin dosyası bu önemli avantaja sahip değildir. Sadece içerik bilgisini ya da en fazla, buna ek olarak, ini uzantılı dosyalardaki gibi, tek seviyeli metadata bilgisini tutarlar. Sadece içerik bilgisi tutan dosyalarda verileri ayırmak için virgül ve benzeri karakterler kullanılır. Yapısallık olmadığından okunabilirlik de ortadan kalkar.

Dezavantajları:
XML dökümanları, içerik bilgisini ve metadatayı yapısal tutarak büyük bir avantaja sahip olmalarına rağmen, bazı projelerde XML’e ihtiyaç duyulmadan basit metin dosyaları kullanılarak daha verimli sonuçlar elde edilebilir. Birkaç parametreyi ve değerlerini, tek seviyeli tutmak için, yaratılacak konfigürasyon dosyasını, XML dökümanı yapmak gereksiz olabilir.
2. XML okunabilir bir yapıya sahiptir
Avantajları:
XML teknolojisinin, sık sık kendinden söz ettiren avantajı, hiçbir ön bilgiye gerek duyulmadan, dökümanın, insan ve makine tarafından okunabilir olmasıdır. Okunabilirlik,  yazılabilirlik avantajını da getirir. XML dökümanlarını yazmak için maliyeti yüksek editörlere gerek yoktur.
Dezavantajları:
XML genelde farklı sistemler arası iletişimi sağladığından dolayı, insan için okunabilir olması aslında çok fazla birşey değiştirmez. Asıl hedef, sistemlerin entegrasyonudur. Mekanizma işlemeye bir kere başladıktan sonra, insanlar belki de uzunca bir süre sisteme dokunmayacaklardır. Fakat formatlı ve okunabilir olması uğruna, dosya ebatları büyültülmüş, ağ trafiği yoğunluğu arttırılmış olur.
İnsanlar isterlerse okunabilir olmayan XML dökümanları yaratabilirler. Birçok uygulama geliştirici kendisi açısından anlamlı olan, başkalarınca hiç birşey ifade etmeyen eleman isimleri kullanabilirler. Örneğin <denopas981> etiketi herkez için anlamlı olmayabilir. Bunun yanında Çince ya da Fransızca dilleri kullanılarak yazılan etiket isimleri de olabilir. Bu dilleri bilmeyen birisi için XML dökümanı okunabilir değildir.
3. XML dökümanlarının işlenmesi kolay ve maliyeti azdır
Avantajları:
Diğer dosya formatları ve veritabanlarının en büyük dezavantajlarından birisi, üzerlerinde işlem yapmak için gereken araçların çok pahalı olmasıdır. Bu dezavantaj, XML dökümanları için geçerli değildir. Çünkü XML işleme araçları dünya çapında çok yaygındır ve ucuzdur. Düzenli bir yapıya sahip olan XML dökümanlarını işlemek amacıyla birçok ayrıştırıcı tasarlanmıştır. Ayrıştırıcıların çoğu tarayıcılar tarafından otomatik olarak desteklenir. W3C, xml dökümanlarını işleyebilmek ve ayrıştırabilmek amacıyla ulusal bir method yaratmıştır. DOM (Document Object Model) adı verilen method, ayrıştırma işlemi için en çok kullanılan tekniklerden biridir. Ağaç-tabanlı işlem modeli olarak da adlandırılır. Geliştirilen ayrıştırıcıların çoğu bu metoda göre tasarlanmıştır.
Dezavantajları:
XML dökümanlarının işlenmesi sadece ayrıştırma demek değildir. Ayrıştırılan döküman verileri üzerinde ilave olarak başka işlemler de yapmak gerekebilir.  Aslında çoğu uygulamalarda, ayrıştırma, birçok adım içerisinden ilkidir. Bazı organizasyonlar, ulusal ayrıştırma metodu olan DOM’un gerçek iş yaşamı uygulamalarında, çok da pratik olmadığını ve kaynakları kötü kullandığını savunmuştur. Çünkü DOM metodunda, büyük ebatlı dökümanlar da dahil olmak üzere, tüm dökümanlar, bellekte ağaç tabanlı bir modele oturtulur.
4. XML teknolojisi, varolan güvenlik çözümlerini destekler
Avantajları:
XML teknolojisi, mevcut internet ve ağ altyapısını desteklediğinden dolayı, bu altyapılar için belirlenen güvenlik kavramlarına, getirilen çözümler, XML için de geçerlidir. Geçerli olan güvenlik kavramları;
  • Authentication, kullanıcının gerçekten doğru kullanıcı olup olmadığının belirlenmesi; XML belgelerinin iletilmesi sırasında dijital imza ve sertifikaların kullanılması
  • Encryption, verilerin şifrelenmesi; XML’in HTTPS üzerinden SSL protokolü kullanılarak iletilmesi. (XMLHTTP objesi)
  • Authorization, bulunduğunuz yerdeki veriye ulaşım hakları (görüntüleme, okuma, yazma, okuma-yazma); Döküman ve protokoller üzerinde uygulanan mevcut tekniklerin XML dökümanlarında da uygulanması
Dezavantajları:
XML varolan yöntemleri ve protokolleri destekler, fakat teknolojinin çalışma mantığından dolayı, yeni tehditlere açıktır. Mesela, XML dökümanları içerisinden, URI (Uniform Resource Identifier) kullanılarak, harici DTD dosyalarına referans edilmesi, bu risklerden bir tanesidir. XML dökümanını kullanan kullanıcılar, referans edilen URI kaynağının güvenli olup olmadığını bilmeden işlemlerine devam ederler. Kaynağa erişen bir saldırgan, DTD üzerinde çeşitli oynamalar yapabilir;
  • OPTIONAL tipte bir özelliğin tipini REQUIRED yapabilir
  • Özelliklerin varsayılan değerlerini değiştirebilir
  • DTD içerisinde geçen varlıkların (entity), içerik metinleri veya referans ettikleri notasyonlar değiştirilerek, çeşitli virüslerin aktive edilmesi sağlanabilir
Ya da, URI kaynaklarının saldırıya uğrayarak ulaşılamaz hale getirilmesi, XML’in geçerlilik işleminin iptal olmasına yol açar.
XML Teknolojisi Programlama Dili Değildir
XML veriyi ve verinin anlamsallığını, belirli geçerlilik kuralları çerçevesinde, belirli bir formatta saklayan bir dökümandır. XML, onu işleyecek ayrıştırıcılara ve uygulamalara ihtiyaç duyar. XML tek başına basit olabilir, fakat XML’in resmi tasarım hedefleri arasında yer alan, ayrıştırma, işleme, entegrasyon, mesajlaşma ve transformasyon gibi işlemler o kadar da kolay değildir. XML’in bir sistem tarafından anlaşılabilir olması için, sistemde bir yerlerde bir kod parçasının, döküman etiketlerinin ne anlama geldiğini bilmesi gerekir. XML standart bir döküman formatı yaratmamızı ve onu kolayca ayrıştırabilmemizi sağlar, fakat her şirket ya da kurum, ortak bir standart yerine, kendi standardını belirlediği için, farklı kurumlar arası haberleşme olabilmesi için, bir ayrıştırıcının yapabileceğinden çok daha fazlasına ihtiyaç vardır. Gerçek hayatta işletmeler, oturup hangi standartlarda veriyi göndereceklerinin anlaşmasına varmalıdır.
Bilgi sistemlerinde geçen dil kavramında genelde bir programlama dilinden bahsedilmesine karşın, XML, C++ ya da Delphi gibi bir programla dili değildir, bir işaretleme dilidir. Aslında XML kullanılarak programlama dilleri yazılmaya çalışılmıştır. Fakat kullanımaları zor olduğu için, uygulama geliştiricileri tarafından edilme tercih edilmemiştir.
Function MerhabaDunya : Boolean;
Begin
  Write(‘Merhaba Dünya’);
  Result := True;
End;
<Function Name=”MerhabaDunya” Type=”Boolean”>
<call function=”Write”>
   <param type=”String”>Merhaba Dünya</param>
</call>
</Function>
Deniz KILINÇ

Yorumlar

Bu blogdaki popüler yayınlar

UML ve Modelleme – Bölüm 4 (Class (Sınıf) Diyagramları)

Bir önceki makalemizde UML modellemede kullanılan ilk diyagram olan Use Case diyagramını incelemiştik. Bu makalemizde nesne tabanlı programlamada kullanılan sınıflar ve sınıfların arasındaki ilişkileri modelleyebileceğimiz diyagramlar olan Class(Sınıf) diyagramlarını inceleyeceğiz. UML’de sınıflar, nesne tabanlı programlama mantığı ile tasarlanmıştır. Sınıf diyagramının amacı bir model içerisinde sınıfların tasvir edilmesidir. Nesne tabanlı uygulamada, sınıfların kendi özellikleri (üye değişkenler), işlevleri (üye fonksiyonlar) ve diğer sınıflarla ilişkileri bulunmaktadır. UML’de sınıf diyagramlarının genel gösterimi aşağıdaki gibidir. Şekil 1. Class Diyagram Şekil1’de görüldüğü üzere bir dikdörtgeni 3 parçaya bölüyoruz. En üst bölüm sınıf adını, orta kısım özellik listesini (üye değişkenler) ve en son kısım, işlev listesini (üye fonksiyonlar) göstermektedir. Çoğu diyagramlarda alt iki bölüm çıkarılır. Genelde tüm özellik ve işlevler gösterilmemektedir. Ama...

Yazılım Maliyet Tahmineleme Tecrübeleri

Yazılım mühendisliğinde maliyet hesabı her zaman problem olmuştur. "Bu iş kaç Adam/Gün tutar?" sorusuyla sıkça karşılaşıyoruz. Adam/gün veya Adam/ay ölçütleri bir kaynağın/kişinin belirtilen zaman dilimindeki iş gücü anlamına gelir. Tabi bu noktada yine kafa karışıklıkları başlar. 6 A/G'lik bir işi hızlandıralım diye 2 kişi ile yapmaya çalışsak ve kaynak/kod, modül, altyapı, insan vb. her bir şeyi bir kenara bıraksak, matematiksel basit formülle 6/2=3 A/G'de biter? Gerçek hayat böyle değil, öncelikle bunu anlamamız lazım. Hep şu örnek verilir; "Aynı bebeği 2 kadın birlikte daha kısa sürede doğurur mu?" Eğer bunun cevabı "Evet" ise (veya bir gün böyle bir durum ortaya çıkarsa), yazımı değiştirmem gerekecek:) Mevzu gerçekten derin...Maliyet hesabı; bulunduğunuz firmanın yazılım süreçlerini hangi methodlarla uyguladığına, ilgili işin o dönemdeki aciliyetine, (şirket yönetiminin baskısına:)) vb. bir çok duruma bağlı olabilir. Örneğin; bizim firmada e...

UML ve Modelleme – Bölüm 3 (Use Case Diyagramlar)

Önceki iki makalemizde ( 1 , 2 ) UML’e genel olarak değinip ve modellemede kullanacağımız dokuz diyagram hakkında bilgiler vermiştik. Bu makalemizde Use Case diyagramından detaylı bahsedeceğiz. Öncelikle, genel Use case diyagramının tanımını hatırlayalım. “Bir kullanıcı ve bir sistem arasındaki etkileşimi anlatan senaryo topluluğudur.” Ivar Jacobson Senaryo tanımı için der ki: “Aktörle sistem arasında gerçekleştirilen, sonucunda aktöre farkedilir getirisi/ faydası oluşan etkileşimli diyalogdur. ” UML Use Case Diyagramları  sistemin işlevselliğini açıklamak amacıyla kullanılır. Sistemin birbirinden ayrı özelliklerinin detaylarını göstermekten ziyade, Use Case Diyagramlar, tüm mevcut işlevselliği göstermek için kullanılabilir. Buradaki en önemli noktalardan biri,   Use Case Diyagramlar temelde sequence diyagram ve akış diyagramlarından farklıdır. Use Case diyagramlar dört ana elemandan oluşmaktadır. Aktörler , Sistem (Proje kapsamını belirtir) , Use Caseler ...