METODE PERTAMA :
· PENGUMPULAN DATA
Pada sebuah perusahaan, data banyak tersimpan
di beberapa system yang berbeda, misalnya pada Microsoft, diperkirakan ada
ratusan database Online Transaction Processing dan lebih dari 70 Data warehouse
tersedia.
Langkah pertama yang harus dilakukan adalah
menarik data yang relevan ke sebuah database atau sebuah datamart yang sudah
menerapkan analisa data.
Misalnya, apabila anda ingin menganalisa apa
saja yang di klik pada website anda, langkah pertama yang harus anda lakukan
adalah mendownload log data dari webserver anda (karena log data ini relevan
kepada catatan apa saja yg diklik oleh pengunjung)
Kadangkala anda dapat saja beruntung karena
apa yang anda butuhkan telah tersedia pada datawarehouse. Hanya saja, pada
banyak kasus, data pada datawarehouse tidak begitu kaya akan informasi, dan
harus dikawinkan dengan beberapa data tambahan dari sumber lain.
Sebagai contoh: (masih pada kasus analisa
klik pada web anda) log data pada webserver hanya berisi data tentang perilaku
pengunjung web yang mengklik sesuatu dan sedikit sekali berisi informasi profil
pengunjung website tersebut. Nah disini tentu anda butuh untuk mengumpulkan
informasi profil pengunjung web anda dari system lain atau membeli data
demografis (lokasi dari mana saja pengunjung web anda berasal) pengunjung web
untuk membangun model yang sesuai dengan kebutuhan bisnis anda.
- . MEMPERKIRAKAN MODEL (MODEL ASSESMENT)
Pada tahapan model assesment ini, anda
menggunakan tools untuk memperkirakan ketepatan dari model yang telah dibuat,
dan anda memeriksa model yang telah dibuat tadi untuk memperkirakan arti dari
pola-pola (patterns) yang ditemukan, dan bagaimana mengaplikasikan apa yang
telah anda temukan kedalam bisnis anda.
Sebagai contoh:
Sebuah model mungkin saja memperkirakan
relasi dari “Suami” -> “jenis kelamin” = “Laki – Laki” dengan tingkat
confidence 100%. Walaupun rule itu adalah benar, tapi hasil tersebut tidak
memiliki nilai yang berarti untuk bisnis.
“Adalah sangat penting bekerja dengan seorang
business analyst yang memiliki domain pengetahuan yang tepat untuk meng-sah-kan
apa yang telah anda temukan pada data anda”
Kadang-kadang sebuah model tidak berisi pola
yang berguna, seringkali ini diakibatkan oleh penetapan dari variabel didalam
model bukanl penetapan yang tepat untuk memecahkan problem bisnis anda. Anda
mungkin saja harus mengulangi proses data cleaning dan data transformation,
atau bahkan mengevaluasi masalah anda demi memperoleh variabel yang lebih
memberi arti.
Data mining adalah sebuah proses
penyelidikan, dan seringkali harus melalui beberapa proses sebelum pada
akhirnya anda menemukan model yang tepat.
Tidak ada komentar:
Posting Komentar