Perbezaan Antara Hierarki dan Pengelompokan Separa

Perbezaan Antara Hierarki dan Pengelompokan Separa
Perbezaan Antara Hierarki dan Pengelompokan Separa

Video: Perbezaan Antara Hierarki dan Pengelompokan Separa

Video: Perbezaan Antara Hierarki dan Pengelompokan Separa
Video: MENGENAL ISTILAH ( LineWT, LureWT) PADA JORAN PANCING. 2024, November
Anonim

Hierarki vs Pengelompokan Separa

Pengkelompokan ialah teknik pembelajaran mesin untuk menganalisis data dan membahagikan kepada kumpulan data yang serupa. Kumpulan atau set data serupa ini dikenali sebagai kelompok. Analisis kelompok melihat algoritma pengelompokan yang boleh mengenal pasti kelompok secara automatik. Hierarki dan Pembahagian ialah dua kelas algoritma pengelompokan sedemikian. Algoritma pengelompokan hierarki memecahkan data ke dalam hierarki kelompok. Algoritma takaran membahagikan set data kepada sekatan yang saling berpisah.

Apakah Pengelompokan Hierarki?

Algoritma pengelompokan hierarki mengulangi kitaran sama ada menggabungkan gugusan yang lebih kecil kepada yang lebih besar atau membahagikan gugusan yang lebih besar kepada yang lebih kecil. Sama ada cara, ia menghasilkan hierarki kelompok yang dipanggil dendogram. Strategi pengelompokan aglomeratif menggunakan pendekatan dari bawah ke atas untuk menggabungkan kelompok ke dalam yang lebih besar, manakala strategi pengelompokan pembahagian menggunakan pendekatan dari atas ke bawah untuk membelah masuk kepada yang lebih kecil. Lazimnya, pendekatan tamak digunakan dalam menentukan kelompok yang lebih besar/kecil digunakan untuk penggabungan/pembahagian. Jarak Euclidean, jarak Manhattan dan persamaan kosinus adalah beberapa metrik persamaan yang paling biasa digunakan untuk data berangka. Untuk data bukan angka, metrik seperti jarak Hamming digunakan. Adalah penting untuk ambil perhatian bahawa pemerhatian sebenar (kejadian) tidak diperlukan untuk pengelompokan hierarki, kerana hanya matriks jarak yang mencukupi. Dendogram ialah perwakilan visual kluster, yang memaparkan hierarki dengan sangat jelas. Pengguna boleh mendapatkan pengelompokan berbeza bergantung pada tahap di mana dendogram dipotong.

Apakah Pengelompokan Separa?

Algoritma pengelompokan separa menjana pelbagai sekatan dan kemudian menilainya mengikut beberapa kriteria. Mereka juga dirujuk sebagai bukan hierarki kerana setiap contoh diletakkan dalam satu daripada k gugusan yang saling eksklusif. Oleh kerana hanya satu set kluster ialah keluaran algoritma kluster separa biasa, pengguna dikehendaki memasukkan bilangan kluster yang dikehendaki (biasanya dipanggil k). Salah satu algoritma pengelompokan separa yang paling biasa digunakan ialah algoritma pengelompokan k-means. Pengguna dikehendaki memberikan bilangan kluster (k) sebelum memulakan dan algoritma mula-mula memulakan pusat (atau centroid) bagi partition k. Secara ringkasnya, algoritma pengelompokan k-means kemudian menetapkan ahli berdasarkan pusat semasa dan menganggarkan semula pusat berdasarkan ahli semasa. Kedua-dua langkah ini diulang sehingga fungsi objektif kesamaan antara kelompok tertentu dan fungsi objektif ketaksamaan antara kelompok dioptimumkan. Oleh itu, permulaan yang wajar bagi pusat adalah faktor yang sangat penting dalam mendapatkan hasil yang berkualiti daripada algoritma pengelompokan separa.

Apakah perbezaan antara Hierarki dan Pengelompokan Separa?

Hierarki dan Pengelompokan Separa mempunyai perbezaan utama dalam masa berjalan, andaian, parameter input dan kelompok terhasil. Biasanya, pengelompokan separa lebih pantas daripada pengelompokan hierarki. Pengelompokan hierarki hanya memerlukan ukuran persamaan, manakala pengelompokan separa memerlukan andaian yang lebih kukuh seperti bilangan gugusan dan pusat awal. Pengelompokan hierarki tidak memerlukan sebarang parameter input, manakala algoritma pengelompokan separa memerlukan bilangan gugusan untuk mula dijalankan. Pengelompokan hierarki mengembalikan pembahagian gugusan yang lebih bermakna dan subjektif tetapi pengelompokan separa menghasilkan kluster tepat. Algoritma pengelompokan hierarki lebih sesuai untuk data kategori selagi ukuran persamaan boleh ditakrifkan sewajarnya.

Disyorkan: