Page 197 - E-Modul Simbad_Neat
P. 197
penjelasan sebelumnya, akan ada 10000/20 = 500 blok data yang diperlukan untuk
membaca baris-baris data dalam tabel Mahamahasiswa. Di samping itu, harus juga
dilakukan pembacaan terhadap blok- blok indeks. Katakanlah, dalam satu blok
(node) indeks dapat tersimpan 200 buah pointer dan dengan adanya 10000 nilai
unik untuk npm, maka indeks tersebut setidaknya membutuhkan antara 50 hingga
100 simpul daun (leaf node yang berada pada level terbawah dari indeks). Dengan
jumlah simpul daun sebanyak itu, maka indeks tersebut memiliki kedalaman hingga
8 level (ingat struktur pohon biner atau binary tree), sehingga ada 8 blok indeks
yang harus dibaca. Dengan hasil-hasil itu, dapat kita peroleh, bahwa operasi seleksi
ini akan membutuhkan 9 pengaksesan blok (lihat formula untuk A3).
8.2.3 Seleksi dengan Pembandingan (Ketidaksamaan)
Perhatikanlah sebuah operasi seleksi dengan bentuk GA(). Dalam ketiadaan
inform informasi mengenai pembandingan (ketidaksamaan), kita asumsikan bahwa
secara rata-rata setengah dari baris-baris data tersebut akan memenuhi kondisi
pembandingan; jadi, hasilnya memiliki nr/2 baris data.
Jika nilai aktual digunakan dalam pembandingan (v), maka biaya query
akan dapat diperkirakan dengan lebih akurat. Nilai-nilai maksimum da disimpan
dalam katalog informasi. Diasumsikan bahwa nilai-nilai atribe terdistribusi secara
merata, kita dapat memperkirakan baris-baris data yang minpmum, yaitu max(A, r)
dan min(A, r), untuk atribut tersebut dape akan memenuhi kondisi A su adalah
sebanyak o jika v < min(A, r) sebanyak n, jika v 2 max(A, r) dan sebanyak n(v-
min(A, r))/(max(A, r min(A, r)) untuk kondisi lainnya.
184