Data Mining adalah Serangkaian proses untuk menggali
nilai tambah berupa informasi yang selama ini tidak diketahui secara manual
dari suatu basisdata dengan melakukan penggalian pola-pola dari data dengan
tujuan untuk memanipulasi data menjadi informasi yang lebih berharga yang
diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau
menarik dari data yang terdapat dalam basisdata.
Data mining biasa
juga dikenal nama lain seperti : Knowledgediscovery (mining)
in databases (KDD), ekstraksi pengetahuan (knowledge extraction) Analisa
data/pola dan kecerdasan bisnis (business
intelligence) dan merupakan alat yang penting untuk memanipulasi
data untuk penyajian informasi sesuai kebutuhan user dengan tujuan untuk
membantu dalam analisis koleksi pengamatan perilaku, secara umum definisi
data-mining dapat diartikan sebagai berikut
§ Proses
penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar.
§ Ekstraksi
dari suatu informasi yang berguna atau menarik (non-trivial, implisit,
sebefumnya belum diketahui potensial kegunaannya) pola atau pengetahuan dari
data yang disimpan dalam jumfah besar.
§ Ekplorasi
dari analisa secara otomatis atau semiotomatis terhadap data-data dalam jumlah
besar untuk mencari pola dan aturan yang berarti.
Konsep Data Mining
Data mining sangat
perlu diperlukan dilakukan terutama dalam mengelola Data yang sangat besar
untuk memudahkan aktifitas recording suatu transaksi dan untuk proses Data Warehousing agar dapat memberikan
informasi yang akurat bagi penggunanya
data mining
Alasan utama
mengapa data mining sangat menarik perhatian industri informasi dalam beberapa
tahun belakangan ini adalah karena tersedianya data dalam jumlah yang besar dan
semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan
pengetahuan yang berguna karena sesuai fokus bidang ilmu ini yaitu melakukan
kegiatan mengekstraksi atau menambang pengetahuan dari data yang
berukuran/berjumlah besar, informasi inilah yang nantinya sangat berguna untuk
pengembangan. berikut langkah-langkahnya :
1. Data Cleaning (untuk
menghilangkan noise data yang tidak konsisten)
2. Data intergration (di
mana sumber data yang terpecah dapat disatukan)
3. Data
selection (di mana data yang relevan dengan tugas analisis
dikembalikan ke dalam database)
4. Data transformation (di
mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan
ringkasan performa atau operasi agresi)
5. Knowledge Discovery (proses
esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data)
6. Pattern evolution (untuk mengidentifikasi pola yang
benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa
tindakan yang menarik)
7. Knowledge presentation (di mana gambaran teknik
visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah
ditambang kepada user).

No comments:
Post a Comment