Page 22 - ENTERTECH-SAYI1
P. 22

detini  ve  verideki  gürültünün   Eksik veriler, yapılacak olan is-  ihtimali söz konusudur ve bu
                 derecesini ifade etmektedir.   tatistiksel  analizlerde  önemli   yanlışlardan  dolayı  veri  ma-
                                                problemlerin  doğmasına  se-   denciliği uygulamaları amacı-
                 Boş Veri: Bir veri tabanındaki   bep  olmaktadır.  İstatistiksel   na kesin olarak ulaşamamak-
                 boş  değer,  birincil  anahtarda   analizler ve bu analizlerin ya-  tadır.
                 yer  almayan  herhangi  bir  ni-  pılmasına  olanak  veren  ilgili
                 teliğin değerinin olma olasılı-  paket programlar, verilerin tü-  Sınırlı Bilgi: Veri tabanları, ge-
                 ğını ifade etmektedir. Boş de-  münün  var  olduğu  durumlar   nellikle basit öğrenme işlerini
                 ğer,  tanımı  gereği  kendisi  de   için geliştirilmiştir.    sağlayan  özellik  ya  da  nite-
                 dahil  olmak  üzere  hiçbir  de-                              likleri  sunmak  gibi  veri  ma-
                 ğere denk olamayan değerleri   Farklı  Tipteki  Verileri  Ele   denciliği  dışındaki  amaçları
                 içermektedir.                  Alma: Gerçek hayattaki uygu-   için hazırlanmaktadır. Bundan
                                                lamalar  makine  öğreniminde   dolayı  öğrenme  yetisini  ko-
                 Dinamik Veri: Kurumsal çev-    olduğu  gibi  yalnızca  sembo-  laylaştıracak  bazı  özelliklerin
                 rimiçi veri tabanları dinamik-  lik  veya  kategorik  veri  türle-  bulunmama  olasılığı  da  söz
                 tir  ve  içeriği  sürekli  olarak   ri  değil,  fakat  aynı  zamanda   konusudur.
                 değişim  göstermektedir.  Bu   tamsayı,  kesirli  sayılar,  çoklu
                 durum bilginin keşfedilme sü-  ortam verisi, coğrafi bilgi içe-  Veri  Tabanı  Boyutu:  Veri  ta-
                 recinde  büyük  sakıncaları  da   ren veri gibi farklı tipteki veri-  banı  boyutları  gün  geçtikçe
                 ifade etmektedir.              ler üzerinde işlem yapılmasını   büyük  bir  hızla  artmaktadır.
                                                gerektirmektedir.              Veri  tabanı  algoritması  çok
                 Eksik  Veri:  Veri  kümesinin                                 sayıda  küçük  örneklemi  ele
                 hacminden  ya  da  doğasın-    Gürültülü  ve  Kayıp  Değerler:   alabilecek  biçimde  gelişti-
                 dan kaynaklanan bir durumu     Veri girişi veya veri toplanma-  rilmiştir.  Aynı  algoritmaların
                 ifade etmektedir. Eksik veriler   sı  esnasında  oluşan  sistem   katsayı olarak çok büyük ör-
                 ile karşılaşıldığında yapılması   dışı  hatalar  gürültü  olarak   neklemlerde  kullanılabilmesi
                 gerekenler şunlardır:          adlandırılmaktadır. Büyük ha-  için  dikkat  edilmesi  gerek-
                 •   Eksik  veri  içeren  kayıt   cimli  veri  tabanlarındaki  pek   mektedir.
                    veya kayıtlar çıkarılabilir.  çok  nitelik  değer  açısından
                 •   Değişkenin    ortalaması   yanlış olabilmektedir. Verilerin      Her dakikada
                    eksik  verilerin  yerine  kul-  toplanması esnasında oluşan   Facebook kullanıcıları
                    lanılabilir.                hatalara ölçümden kaynakla-       yaklaşık 31.25 milyon
                 •   Var  olan  verilere  daya-  nan hatalar da dahil edilmek-     mesaj gönderiyor ve
                    lı  olarak  en  uygun  değer   tedir. Bu hataların neticesinde   2.77 milyon video
                    kullanılabilir.             niteliğin değerinin yanlış olma           izliyor.
































                    20
   17   18   19   20   21   22   23   24   25   26   27