Perbezaan Antara Semi Join dan Bloom Join

Perbezaan Antara Semi Join dan Bloom Join
Perbezaan Antara Semi Join dan Bloom Join

Video: Perbezaan Antara Semi Join dan Bloom Join

Video: Perbezaan Antara Semi Join dan Bloom Join
Video: Yakin Masih Mau Beli Nintendo Wii?? 2024, November
Anonim

Semi Sertai lwn Bloom Sertai

Semi join dan Bloom join ialah dua kaedah penyambungan yang digunakan dalam pemprosesan pertanyaan untuk pangkalan data teragih. Apabila memproses pertanyaan dalam pangkalan data teragih, data perlu dipindahkan antara pangkalan data yang terletak di tapak yang berbeza. Ini boleh menjadi operasi yang mahal bergantung pada jumlah data yang perlu dipindahkan. Oleh itu, apabila memproses pertanyaan dalam persekitaran pangkalan data teragih, adalah penting untuk mengoptimumkan pertanyaan untuk meminimumkan jumlah data yang dipindahkan antara tapak. Semi join dan bloom join ialah dua kaedah yang boleh digunakan untuk mengurangkan jumlah pemindahan data dan melaksanakan pemprosesan pertanyaan yang cekap.

Apakah Semi Join?

Semi join ialah kaedah yang digunakan untuk pemprosesan pertanyaan yang cekap dalam persekitaran pangkalan data teragih. Pertimbangkan situasi di mana pangkalan data Pekerja (memegang maklumat seperti nama pekerja, nombor jabatan tempat dia bekerja, dsb) terletak di tapak 1 dan pangkalan data Jabatan (memegang maklumat seperti nombor jabatan, nama jabatan, lokasi, dll) terletak di tapak. 2. Contohnya, jika kita ingin mendapatkan nama pekerja dan nama jabatan tempat dia bekerja (hanya jabatan yang terletak di "New York"), dengan melaksanakan pertanyaan di pemproses pertanyaan yang terletak di tapak 3, terdapat beberapa cara untuk data boleh dipindahkan antara tiga tapak untuk mencapai tugas ini. Tetapi apabila memindahkan data, adalah penting untuk ambil perhatian bahawa tidak perlu memindahkan seluruh pangkalan data antara tapak. Hanya beberapa atribut (atau tupel) yang diperlukan untuk gabungan perlu dipindahkan antara tapak untuk melaksanakan pertanyaan dengan cekap. Semi join ialah kaedah yang boleh digunakan untuk mengurangkan jumlah data yang dihantar antara tapak. Dalam gabungan separuh, hanya lajur sambung dipindahkan dari satu tapak ke tapak yang lain dan kemudian lajur yang dipindahkan itu digunakan untuk mengurangkan saiz hubungan yang dihantar antara tapak lain. Untuk contoh di atas, anda hanya boleh memindahkan nombor jabatan dan nama jabatan tupel dengan lokasi=”New York” dari tapak 2 ke tapak 1 dan lakukan penyambungan di tapak 1 dan pindahkan hubungan terakhir kembali ke tapak 3.

Apakah Bloom Join?

Seperti yang dinyatakan sebelum ini, bloom join ialah kaedah lain yang digunakan untuk mengelakkan pemindahan data yang tidak diperlukan antara tapak apabila melaksanakan pertanyaan dalam persekitaran pangkalan data yang diedarkan. Dalam bloom join, daripada memindahkan lajur sambung itu sendiri, perwakilan padat lajur sambung dipindahkan antara tapak. Bloom join menggunakan penapis bloom yang menggunakan sedikit vektor untuk melaksanakan pertanyaan keahlian. Pertama, penapis bloom dibina menggunakan lajur gabungan dan ia dipindahkan antara tapak dan kemudian operasi penyambungan dilakukan.

Apakah perbezaan antara Semi Join dan Bloom Join?

Walaupun kedua-dua kaedah sambung separuh dan sambung mekar digunakan untuk meminimumkan jumlah data yang dipindahkan antara tapak apabila melaksanakan pertanyaan dalam persekitaran pangkalan data yang diedarkan, sambung bloom mengurangkan jumlah data (bilangan tupel) yang dipindahkan berbanding dengan separuh bergabung dengan menggunakan konsep penapis mekar, yang menggunakan sedikit vektor untuk menentukan keahlian yang ditetapkan. Oleh itu menggunakan bloom join akan menjadi lebih cekap daripada menggunakan semi join.

Disyorkan: