Page 21 - Entertech Dergi Sayı 1
P. 21

Veri madenciliğini  getiren  donanım  kavramıdır.      bilgi  keşfi,  teori,  deney  ve  si-
                       etkileyen faktörler    Üçüncü  sırada  bilgisayar  ağ-  mülasyonu birbiri ile bağlantılı
                                bulunuyor     ları  yer  almaktadır.  Bilgisa-  bir hale getirmekte önemli rol
                                              yar  ağları;  yeni  nesil  internet,   oynamaktadır. Beşinci ve son
               Haldun  Akpınar’a  göre  veri   çok yüksek hızları kullanmayı   olarak  ticari  eğilimler  ön  pla-
               madenciliği  temel  olarak  beş   sağlamıştır. Bu doğrultuda bir   na  çıkmaktadır.  Günümüzde
               ana  faktörden  etkilenmekte-  bilgisayar ağı oluşturulduktan   kurum,  kuruluş  ve  işletmeler
               dir. Bunlardan ilki veridir. Veri,   sonra,  dağınık  verileri  analiz   rekabet  ortamında  varlıklarını
               veri  madenciliği  alanının  iler-  etmek ve farklı algoritmaların   koruyabilmek  için  daha  hızlı
               lenmesinde  en  önemli  faktör   kullanımı da mümkün bir hale   hareket  etmek  zorundadır  ve
               olarak  karşımıza  çıkmaktadır.   gelecektir.  Dördüncü  sırada   rekabet stratejilerinde farklılık-
               İkinci sırada donanım kavramı   ise bilimsel hesaplamalar bu-  lara gitmelidir. Bundan dolayı
               yer almaktadır. Gelişen bellek   lunmaktadır.  Günümüz  bilim   daha  yüksek  kalitede  hizmet
               ve işlem hızı kapasitesi saye-  insanları  ve  mühendisleri;  si-  sunmalıdır.  Bütün  bunları  ya-
               sinde, birkaç yıl önce maden-  mülasyonu,  bilimin  üçüncü     parken  de  minimum  maliyeti
               cilik  yapılamayan  veriler  üze-  yolu  olarak  görmektedirler.   ve  en  az  insan  gücünü  göz
               rinde çalışmayı mümkün hale    Veri  madenciliği  kavramı  ve   önünde bulundurmalıdırlar.



                                                                             Ortaya çıkan sorunlara
                                                                             dikkat edilmesi gerek

                                                                              Büyük hacimli veri depolarının
                                                                              bulunduğu  veri  ortamlarında
                                                                              büyük  sorunların  ortaya  çık-
                                                                              ma  riski  oldukça  yüksektir.
                                                                              Dolayısıyla küçük veri kümele-
                                                                              rinde,  benzetim  ortamlarında
                                                                              hazırlanmış  veri  madenciliği
                                                                              sistemlerinin,  büyük  hacimli,
                                                                              eksik, gürültülü, boş, atık, ay-
                                                                              kırı veya belirsiz veri kümele-
                                                                              rinin  bulunduğu  ortamlarda
                                                                              yanlış çalışabilme olasılığı da
                                                                              bulunmaktadır.  Bu  nedenle
                                                                              veri madenciliği uygulamaları
                                                                              sistemleri geliştirilirken, bu tür
                                                                              sorunların  da  çözümlenmesi
                                                                              gerekmektedir. Veri madenci-
                                                                              liği  uygulamalarında  karşıla-
                                                                              şılabilecek sorunlar şunlardır:


                                                                              Artık  Veri:  Bu  kavram,  prob-
                                                                              lemde  istenilen  sonucu  elde
                                                                              etmek  için  kullanılan  örnek-
                                                                              lem  kümesindeki  gereksiz
                                                                              nitelikleri  kapsamaktadır.  Bu
                                                                              durumun  gerçekleşme  olası-
                                                                              lığı  oldukça  yüksektir  ve  pek
                                                                              çok işlem sırasında karşılaşıl-
                     Veribilimciler, veri hacminin her iki yılda ikiye        maktadır.
                     katlandığını ve böylece 2020’ye kadar 40 ZB
                         noktasına ulaşacağını düşünüyorlar.                  Belirsizlik:  Yanlışlıkların  şid-



                                                                                                     19
   16   17   18   19   20   21   22   23   24   25   26