Perlombongan Data lwn OLAP
Kedua-dua perlombongan data dan OLAP ialah dua daripada teknologi Perisikan Perniagaan (BI) biasa. Perisikan perniagaan merujuk kepada kaedah berasaskan komputer untuk mengenal pasti dan mengekstrak maklumat berguna daripada data perniagaan. Perlombongan data ialah bidang sains komputer yang, berurusan dengan mengekstrak corak menarik daripada set data yang besar. Ia menggabungkan banyak kaedah daripada kecerdasan buatan, statistik dan pengurusan pangkalan data. OLAP (pemprosesan analitik dalam talian) seperti namanya ialah kompilasi cara untuk menanyakan pangkalan data berbilang dimensi.
Perlombongan data juga dikenali sebagai Penemuan Pengetahuan dalam data (KDD). Seperti yang dinyatakan di atas, ia adalah bidang sains komputer, yang berkaitan dengan pengekstrakan maklumat yang tidak diketahui dan menarik sebelum ini daripada data mentah. Disebabkan oleh pertumbuhan data yang eksponen, terutamanya dalam bidang seperti perniagaan, perlombongan data telah menjadi alat yang sangat penting untuk menukar kekayaan data yang besar ini kepada risikan perniagaan, kerana pengekstrakan corak secara manual telah menjadi kelihatan mustahil dalam beberapa dekad yang lalu. Sebagai contoh, ia kini digunakan untuk pelbagai aplikasi seperti analisis rangkaian sosial, pengesanan penipuan dan pemasaran. Perlombongan data biasanya berkaitan dengan empat tugas berikut: pengelompokan, pengelasan, regresi dan perkaitan. Pengelompokan ialah mengenal pasti kumpulan yang serupa daripada data tidak berstruktur. Klasifikasi ialah peraturan pembelajaran yang boleh digunakan pada data baharu dan biasanya akan merangkumi langkah berikut: prapemprosesan data, mereka bentuk pemodelan, pembelajaran/pemilihan ciri dan penilaian/pengesahan. Regresi ialah mencari fungsi dengan ralat minimum untuk memodelkan data. Dan persatuan mencari hubungan antara pembolehubah. Perlombongan data biasanya digunakan untuk menjawab soalan seperti apakah produk utama yang mungkin membantu memperoleh keuntungan tinggi tahun depan di Wal-Mart.
OLAP ialah kelas sistem, yang memberikan jawapan kepada pertanyaan berbilang dimensi. Biasanya OLAP digunakan untuk pemasaran, belanjawan, ramalan dan aplikasi serupa. Sudah semestinya pangkalan data yang digunakan untuk OLAP dikonfigurasikan untuk pertanyaan kompleks dan ad-hoc dengan mengambil kira prestasi pantas. Biasanya matriks digunakan untuk memaparkan output OLAP. Baris dan lajur dibentuk oleh dimensi pertanyaan. Mereka sering menggunakan kaedah pengagregatan pada berbilang jadual untuk mendapatkan ringkasan. Sebagai contoh, ia boleh digunakan untuk mengetahui tentang jualan tahun ini di Wal-Mart berbanding tahun lepas? Apakah ramalan jualan pada suku seterusnya? Apakah yang boleh dikatakan tentang arah aliran dengan melihat peratusan perubahan?
Walaupun jelas bahawa Perlombongan Data dan OLAP adalah serupa kerana ia beroperasi pada data untuk mendapatkan kecerdasan, perbezaan utama datang daripada cara ia beroperasi pada data. Alat OLAP menyediakan analisis data berbilang dimensi dan ia menyediakan ringkasan data tetapi sebaliknya, perlombongan data memfokuskan pada nisbah, corak dan pengaruh dalam set data. Itu adalah perjanjian OLAP dengan pengagregatan, yang bermuara kepada pengendalian data melalui "penambahan" tetapi perlombongan data sepadan dengan "bahagian". Perbezaan ketara lain ialah sementara alat perlombongan data memodelkan data dan mengembalikan peraturan yang boleh diambil tindakan, OLAP akan menjalankan teknik perbandingan dan kontras sepanjang dimensi perniagaan dalam masa nyata.