Page 201 - E-Modul Simbad_Neat
P. 201
• Dalam contoh kita, mahamahasiswa nilai, atribut npm dalam tabel
mahamahasiswa merupakan key-asing bagi tabel Nilai, sehingga ukuran dari
operasi Natural Join terhadap kedua tabel persis sama dengan mas yaitu 1200.
Kasus yang paling sulit terjadi jika RS bukan merupakan key baik bagi R
maupun S. Pada kasus ini, kita asumsikan, sebagaimana telah kita lakukan dalam
operasi Seleksi, bahwa setiap nilai yang sama di kedua tabel memiliki frekuensi
kemunculan yang merata (distribusi datanya seragam). Perhatikan sebuah baris data
t dalam tabel r, dan anggaplah R S=(A). Dapat kita perkirakan bahwa baris data t
menghasilkan:
( , )
baris data dalam r x s, karena nilai ini merupakan rata-rata dari baris- baris
data dalam tabel s dengan sebuah nilai untuk atribut A. Maka untuk semua baris
data dalam tabel r, kita perkirakan akan memiliki:
∗
( , )
Baris data dalam rx s. perhatikanlah, bahwa jika kita membalik situasi r dan
s yang telah ditunjukkan dalam perkiraan sebelumnya, kita akan mendapatkan
estimasi:
∗
( , )
baris data dalam r x s. Kedua hasil estimasi akan berbeda jika V(A, r) V(A,
s). Jika situasi ini terjadi, itu artinya akan ada kesenjangan baris data (dangling
tuples) yang tidak berpartisipasi dalam operasi Join tersebut. Estimasi yang nilainya
lebih kecil akan lebih akurat.
188