Page 21 - ENTERTECH-SAYI1
P. 21
Veri madenciliğini getiren donanım kavramıdır. bilgi keşfi, teori, deney ve si-
etkileyen faktörler Üçüncü sırada bilgisayar ağ- mülasyonu birbiri ile bağlantılı
bulunuyor ları yer almaktadır. Bilgisa- bir hale getirmekte önemli rol
yar ağları; yeni nesil internet, oynamaktadır. Beşinci ve son
Haldun Akpınar’a göre veri çok yüksek hızları kullanmayı olarak ticari eğilimler ön pla-
madenciliği temel olarak beş sağlamıştır. Bu doğrultuda bir na çıkmaktadır. Günümüzde
ana faktörden etkilenmekte- bilgisayar ağı oluşturulduktan kurum, kuruluş ve işletmeler
dir. Bunlardan ilki veridir. Veri, sonra, dağınık verileri analiz rekabet ortamında varlıklarını
veri madenciliği alanının iler- etmek ve farklı algoritmaların koruyabilmek için daha hızlı
lenmesinde en önemli faktör kullanımı da mümkün bir hale hareket etmek zorundadır ve
olarak karşımıza çıkmaktadır. gelecektir. Dördüncü sırada rekabet stratejilerinde farklılık-
İkinci sırada donanım kavramı ise bilimsel hesaplamalar bu- lara gitmelidir. Bundan dolayı
yer almaktadır. Gelişen bellek lunmaktadır. Günümüz bilim daha yüksek kalitede hizmet
ve işlem hızı kapasitesi saye- insanları ve mühendisleri; si- sunmalıdır. Bütün bunları ya-
sinde, birkaç yıl önce maden- mülasyonu, bilimin üçüncü parken de minimum maliyeti
cilik yapılamayan veriler üze- yolu olarak görmektedirler. ve en az insan gücünü göz
rinde çalışmayı mümkün hale Veri madenciliği kavramı ve önünde bulundurmalıdırlar.
Ortaya çıkan sorunlara
dikkat edilmesi gerek
Büyük hacimli veri depolarının
bulunduğu veri ortamlarında
büyük sorunların ortaya çık-
ma riski oldukça yüksektir.
Dolayısıyla küçük veri kümele-
rinde, benzetim ortamlarında
hazırlanmış veri madenciliği
sistemlerinin, büyük hacimli,
eksik, gürültülü, boş, atık, ay-
kırı veya belirsiz veri kümele-
rinin bulunduğu ortamlarda
yanlış çalışabilme olasılığı da
bulunmaktadır. Bu nedenle
veri madenciliği uygulamaları
sistemleri geliştirilirken, bu tür
sorunların da çözümlenmesi
gerekmektedir. Veri madenci-
liği uygulamalarında karşıla-
şılabilecek sorunlar şunlardır:
Artık Veri: Bu kavram, prob-
lemde istenilen sonucu elde
etmek için kullanılan örnek-
lem kümesindeki gereksiz
nitelikleri kapsamaktadır. Bu
durumun gerçekleşme olası-
lığı oldukça yüksektir ve pek
çok işlem sırasında karşılaşıl-
Veribilimciler, veri hacminin her iki yılda ikiye maktadır.
katlandığını ve böylece 2020’ye kadar 40 ZB
noktasına ulaşacağını düşünüyorlar. Belirsizlik: Yanlışlıkların şid-
19