8 Mart 2016 Salı

Veri Madenciliği ( Data Mining)

Veri Madenciliği Nedir?

Büyük ölçekli veriler arasında bilgiye ulaşma ya da büyük veri yığınlarının içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayan bağlantıların bilgisayar programı kullanarak aranmasını sağlamaktır.

En basit tanımıyla yılar geçtikçe artan veri yığınından en kaliteli, güvenli ve sağlıklısını ayıklamaktır. Neden ihtiyaç duyulmuş aşağıdaki resimde gösterebiliriz.

Birbirine benzeyen veriler, temizlenmemiş veriler, kompleks veriler, veriler veriler veriler.... Bir çok veri var ve bunlara ulaşmak oldukça kolay fakat bunların en kalitelisine ve en sağlıklısına ulaşmak ise epey zor..


Bu verilerin çoğu da Veri Madenciliği yöntemiyle Faydalı bilgiye dönüşüyor. Birçok kaynakta ise veri madenciliği ve bilgi keşfi terimlerinin aynı olduğunu söylüyor. Fakat veri madenciliği bilgi keşfi teorisinin bir aşamasıdır.

  1. Veri temizleme (gürültülü ve tutarsız verileri çıkarmak)
  2. Veri bütünleştirme (birçok veri kaynağını birleştirebilmek)
  3. Veri seçme (yapılacak olan analizle ilgili olan verileri belirlemek )
  4. Veri dönüşümü (verinin veri madenciliği tekniğinden kullanılabilecek hale dönüşümünü gerçekleştirmek)
  5. Veri madenciliği (veri örüntülerini yakalayabilmek için akıllı metotları uygulamak)
  6. Örüntü değerlendirme (bâzı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak)
  7. Bilgi sunumu (mâdenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek).
Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Bu da; kümeleme, veri özetleme, değişikliklerin analizi, sapmaların tespiti gibi belirli sayıda teknik yaklaşımları içerir.

Veri Madenciliği konusunda az da olsa bilgi sahibi edindiysek şimdi ki asıl yansıtma yapacağımız konu olan Veri Madenciliğinde Kişiselleştirilmiş Ağ. 

Hiç yorum yok:

Yorum Gönder