Perbezaan Antara Pembelajaran Mesin Diawasi dan Tidak Diawasi

Isi kandungan:

Perbezaan Antara Pembelajaran Mesin Diawasi dan Tidak Diawasi
Perbezaan Antara Pembelajaran Mesin Diawasi dan Tidak Diawasi

Video: Perbezaan Antara Pembelajaran Mesin Diawasi dan Tidak Diawasi

Video: Perbezaan Antara Pembelajaran Mesin Diawasi dan Tidak Diawasi
Video: Belajar Machine Learning - #02 Perbedaan Supervised dan Unsupervised Learning 2024, Julai
Anonim

Perbezaan Utama – Pembelajaran Mesin Diawasi vs Tidak Diawasi

Pembelajaran diselia dan pembelajaran tanpa penyeliaan ialah dua konsep teras pembelajaran mesin. Pembelajaran Terselia ialah tugas Pembelajaran Mesin untuk mempelajari fungsi yang memetakan input kepada output berdasarkan contoh pasangan input-output. Pembelajaran Tanpa Selia ialah tugas Pembelajaran Mesin untuk membuat kesimpulan fungsi untuk menerangkan struktur tersembunyi daripada data tidak berlabel. Perbezaan utama antara pembelajaran mesin diselia dan tidak diselia ialah pembelajaran diselia menggunakan data berlabel manakala pembelajaran tidak diselia menggunakan data tidak berlabel.

Pembelajaran Mesin ialah satu bidang dalam Sains Komputer yang memberikan keupayaan untuk sistem komputer belajar daripada data tanpa diprogramkan secara eksplisit. Ia membolehkan untuk menganalisis data dan meramalkan corak di dalamnya. Terdapat banyak aplikasi pembelajaran mesin. Sebahagian daripadanya ialah pengecaman muka, pengecaman isyarat dan pengecaman pertuturan. Terdapat pelbagai algoritma yang berkaitan dengan pembelajaran mesin. Sebahagian daripadanya ialah regresi, pengelasan dan pengelompokan. Bahasa pengaturcaraan yang paling biasa untuk membangunkan aplikasi berasaskan pembelajaran mesin ialah R dan Python. Bahasa lain seperti Java, C++ dan Matlab juga boleh digunakan.

Apakah Pembelajaran Terselia?

Dalam sistem berasaskan pembelajaran mesin, model berfungsi mengikut algoritma. Dalam pembelajaran terselia, model diselia. Pertama, ia diperlukan untuk melatih model. Dengan pengetahuan yang diperoleh, ia boleh meramalkan jawapan untuk kejadian masa hadapan. Model ini dilatih menggunakan set data berlabel. Apabila kehabisan data sampel diberikan kepada sistem, ia boleh meramalkan hasilnya. Berikut ialah petikan kecil daripada set data IRIS yang popular.

Perbezaan Antara Pembelajaran Diselia dan Tidak Diselia_Rajah 02
Perbezaan Antara Pembelajaran Diselia dan Tidak Diselia_Rajah 02

Mengikut jadual di atas, Panjang Sepal, Lebar Sepal, Panjang Patel, Lebar Patel dan Spesies dipanggil atribut. Lajur dikenali sebagai ciri. Satu baris mempunyai data untuk semua atribut. Oleh itu, satu baris dipanggil pemerhatian. Data boleh sama ada berangka atau kategori. Model diberi pemerhatian dengan nama spesies yang sepadan sebagai input. Apabila pemerhatian baharu diberikan, model harus meramalkan jenis spesies yang dimilikinya.

Dalam pembelajaran diselia, terdapat algoritma untuk pengelasan dan regresi. Pengelasan ialah proses mengklasifikasikan data berlabel. Model mencipta sempadan yang memisahkan kategori data. Apabila data baharu diberikan kepada model, ia boleh mengkategorikan berdasarkan tempat titik itu wujud. K-Nearest Neighbors (KNN) ialah model klasifikasi. Bergantung pada nilai k, kategori ditentukan. Contohnya, apabila k ialah 5, jika titik data tertentu menghampiri lapan titik data dalam kategori A dan enam titik data dalam kategori B, maka titik data akan diklasifikasikan sebagai A.

Regression ialah proses meramal arah aliran data sebelumnya untuk meramalkan hasil data baharu. Dalam regresi, output boleh terdiri daripada satu atau lebih pembolehubah berterusan. Ramalan dilakukan menggunakan garisan yang meliputi kebanyakan titik data. Model regresi yang paling mudah ialah regresi linear. Ia pantas dan tidak memerlukan parameter penalaan seperti dalam KNN. Jika data menunjukkan arah aliran parabola, maka model regresi linear tidak sesuai.

Perbezaan Antara Pembelajaran Diselia dan Tanpa Penyeliaan
Perbezaan Antara Pembelajaran Diselia dan Tanpa Penyeliaan

Itu adalah beberapa contoh algoritma pembelajaran yang diselia. Secara umumnya, keputusan yang dihasilkan daripada kaedah pembelajaran yang diselia adalah lebih tepat dan boleh dipercayai kerana data input diketahui dan dilabelkan dengan baik. Oleh itu, mesin perlu menganalisis hanya corak tersembunyi.

Apakah Pembelajaran Tanpa Pengawasan?

Dalam pembelajaran tanpa pengawasan, model tidak diawasi. Model berfungsi sendiri, untuk meramalkan hasilnya. Ia menggunakan algoritma pembelajaran mesin untuk membuat kesimpulan tentang data tidak berlabel. Secara amnya, algoritma pembelajaran tanpa pengawasan adalah lebih sukar daripada algoritma pembelajaran diselia kerana terdapat sedikit maklumat. Pengelompokan ialah sejenis pembelajaran tanpa pengawasan. Ia boleh digunakan untuk mengumpulkan data yang tidak diketahui menggunakan algoritma. Pengelompokan berasaskan k-min dan ketumpatan ialah dua algoritma pengelompokan.

k-min algoritma, meletakkan k centroid secara rawak untuk setiap kelompok. Kemudian setiap titik data diberikan kepada centroid terdekat. Jarak Euclidean digunakan untuk mengira jarak dari titik data ke centroid. Titik data dikelaskan kepada kumpulan. Kedudukan untuk k centroid dikira semula. Kedudukan centroid baru ditentukan oleh min semua mata dalam kumpulan. Sekali lagi setiap titik data diberikan kepada centroid terdekat. Proses ini berulang sehingga centroid tidak lagi berubah. k-mean ialah algoritma pengelompokan pantas, tetapi tiada pemulaan khusus titik pengelompokan. Selain itu, terdapat variasi tinggi model pengelompokan berdasarkan pemulaan titik kelompok.

Algoritma pengelompokan lain ialah pengelompokan berasaskan kepadatan. Ia juga dikenali sebagai Aplikasi Pengelompokan Spatial Berasaskan Kepadatan dengan bunyi bising. Ia berfungsi dengan mentakrifkan kluster sebagai set maksimum titik bersambung kepadatan. Ia adalah dua parameter yang digunakan untuk pengelompokan berasaskan kepadatan. Ia adalah Ɛ (epsilon) dan mata minimum. Ɛ ialah jejari maksimum kejiranan. Mata minimum ialah bilangan mata minimum dalam kejiranan Ɛ untuk menentukan gugusan. Itulah beberapa contoh pengelompokan yang termasuk dalam pembelajaran tanpa pengawasan.

Secara amnya, hasil yang dihasilkan daripada algoritma pembelajaran tanpa pengawasan adalah tidak begitu tepat dan boleh dipercayai kerana mesin perlu mentakrif dan melabel data input sebelum menentukan corak dan fungsi tersembunyi.

Apakah Persamaan Antara Pembelajaran Mesin Diawasi dan Tidak Diawasi?

Pembelajaran Dalam Selia dan Tanpa Selia ialah jenis Pembelajaran Mesin

Apakah Perbezaan Antara Pembelajaran Mesin Diawasi dan Tidak Diawasi?

Pembelajaran Mesin Diselia lwn Tanpa Selia

Pembelajaran Terselia ialah tugas Pembelajaran Mesin untuk mempelajari fungsi yang memetakan input kepada output berdasarkan contoh pasangan input-output. Pembelajaran Tanpa Selia ialah tugas Pembelajaran Mesin untuk membuat kesimpulan fungsi untuk menerangkan struktur tersembunyi daripada data tidak berlabel.
Fungsi Utama
Dalam pembelajaran diselia, model meramalkan hasil berdasarkan data input berlabel. Dalam pembelajaran tanpa pengawasan, model meramalkan hasil tanpa data berlabel dengan mengenal pasti coraknya sendiri.
Ketepatan Keputusan
Hasil yang dihasilkan daripada kaedah pembelajaran diselia adalah lebih tepat dan boleh dipercayai. Hasil yang dihasilkan daripada kaedah pembelajaran tanpa pengawasan adalah tidak begitu tepat dan boleh dipercayai.
Algoritma Utama
Terdapat algoritma untuk regresi dan pengelasan dalam pembelajaran diselia. Terdapat algoritma untuk pengelompokan dalam pembelajaran tanpa pengawasan.

Ringkasan – Pembelajaran Mesin Diawasi vs Tidak Diawasi

Pembelajaran Terselia dan Pembelajaran Tanpa Selia ialah dua jenis Pembelajaran Mesin. Pembelajaran Terselia ialah tugas Pembelajaran Mesin untuk mempelajari fungsi yang memetakan input kepada output berdasarkan contoh pasangan input-output. Pembelajaran Tanpa Selia ialah tugas Pembelajaran Mesin untuk membuat kesimpulan fungsi untuk menerangkan struktur tersembunyi daripada data tidak berlabel. Perbezaan antara pembelajaran mesin diselia dan tidak diselia ialah pembelajaran diselia menggunakan data berlabel manakala condong tidak diselia menggunakan data tidak berlabel.

Disyorkan: