Page 197 - E-Modul Simbad

Page 197 - E-Modul Simbad_Neat

P. 197

penjelasan sebelumnya, akan ada 10000/20 = 500 blok data yang diperlukan untuk

membaca baris-baris data dalam tabel Mahamahasiswa. Di samping itu, harus juga

dilakukan pembacaan terhadap blok- blok indeks. Katakanlah, dalam satu blok

(node) indeks dapat tersimpan 200 buah pointer dan dengan adanya 10000 nilai

unik untuk npm, maka indeks tersebut setidaknya membutuhkan antara 50 hingga

100 simpul daun (leaf node yang berada pada level terbawah dari indeks). Dengan

jumlah simpul daun sebanyak itu, maka indeks tersebut memiliki kedalaman hingga

8 level (ingat struktur pohon biner atau binary tree), sehingga ada 8 blok indeks

yang harus dibaca. Dengan hasil-hasil itu, dapat kita peroleh, bahwa operasi seleksi

ini akan membutuhkan 9 pengaksesan blok (lihat formula untuk A3).

8.2.3 Seleksi dengan Pembandingan (Ketidaksamaan)

Perhatikanlah sebuah operasi seleksi dengan bentuk GA(). Dalam ketiadaan

inform informasi mengenai pembandingan (ketidaksamaan), kita asumsikan bahwa

secara rata-rata setengah dari baris-baris data tersebut akan memenuhi kondisi

pembandingan; jadi, hasilnya memiliki nr/2 baris data.

Jika nilai aktual digunakan dalam pembandingan (v), maka biaya query

akan dapat diperkirakan dengan lebih akurat. Nilai-nilai maksimum da disimpan

dalam katalog informasi. Diasumsikan bahwa nilai-nilai atribe terdistribusi secara

merata, kita dapat memperkirakan baris-baris data yang minpmum, yaitu max(A, r)

dan min(A, r), untuk atribut tersebut dape akan memenuhi kondisi A su adalah

sebanyak o jika v < min(A, r) sebanyak n, jika v 2 max(A, r) dan sebanyak n(v-

min(A, r))/(max(A, r min(A, r)) untuk kondisi lainnya.

184

192 193 194 195 196 197 198 199 200 201 202