Pages

Ads 468x60px

Minggu, 18 Maret 2012

DATA MINING OUTLIER ANLYSIS



METODE  PERTAMA :

·                  PENGUMPULAN DATA

Pada sebuah perusahaan, data banyak tersimpan di beberapa system yang berbeda, misalnya pada Microsoft, diperkirakan ada ratusan database Online Transaction Processing dan lebih dari 70 Data warehouse tersedia.

Langkah pertama yang harus dilakukan adalah menarik data yang relevan ke sebuah database atau sebuah datamart yang sudah menerapkan analisa data.

Misalnya, apabila anda ingin menganalisa apa saja yang di klik pada website anda, langkah pertama yang harus anda lakukan adalah mendownload log data dari webserver anda (karena log data ini relevan kepada catatan apa saja yg diklik oleh pengunjung)

Kadangkala anda dapat saja beruntung karena apa yang anda butuhkan telah tersedia pada datawarehouse. Hanya saja, pada banyak kasus, data pada datawarehouse tidak begitu kaya akan informasi, dan harus dikawinkan dengan beberapa data tambahan dari sumber lain.

Sebagai contoh: (masih pada kasus analisa klik pada web anda) log data pada webserver hanya berisi data tentang perilaku pengunjung web yang mengklik sesuatu dan sedikit sekali berisi informasi profil pengunjung website tersebut. Nah disini tentu anda butuh untuk mengumpulkan informasi profil pengunjung web anda dari system lain atau membeli data demografis (lokasi dari mana saja pengunjung web anda berasal) pengunjung web untuk membangun model yang sesuai dengan kebutuhan bisnis anda.



 


 METODE KEDUA :
    

  •       . MEMPERKIRAKAN MODEL (MODEL ASSESMENT)
Pada tahapan model assesment ini, anda menggunakan tools untuk memperkirakan ketepatan dari model yang telah dibuat, dan anda memeriksa model yang telah dibuat tadi untuk memperkirakan arti dari pola-pola (patterns) yang ditemukan, dan bagaimana mengaplikasikan apa yang telah anda temukan kedalam bisnis anda.
Sebagai contoh:

Sebuah model mungkin saja memperkirakan relasi dari “Suami” -> “jenis kelamin” = “Laki – Laki” dengan tingkat confidence 100%. Walaupun rule itu adalah benar, tapi hasil tersebut tidak memiliki nilai yang berarti untuk bisnis.
“Adalah sangat penting bekerja dengan seorang business analyst yang memiliki domain pengetahuan yang tepat untuk meng-sah-kan apa yang telah anda temukan pada data anda”

Kadang-kadang sebuah model tidak berisi pola yang berguna, seringkali ini diakibatkan oleh penetapan dari variabel didalam model bukanl penetapan yang tepat untuk memecahkan problem bisnis anda. Anda mungkin saja harus mengulangi proses data cleaning dan data transformation, atau bahkan mengevaluasi masalah anda demi memperoleh variabel yang lebih memberi arti.
Data mining adalah sebuah proses penyelidikan, dan seringkali harus melalui beberapa proses sebelum pada akhirnya anda menemukan model yang tepat.







Tidak ada komentar:

Posting Komentar