Pengertian datamining adalah Serangkaian proses untuk
menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara
manual dari suatu basisdata.
Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali
pola yang penting atau menarik dari data yang terdapat dalam basisdata.
Hal-hal yang
melatarbelakangi datamining
· Melimpahnya
data (overload data) yang dialami oleh berbagai institusi, perusahaan atau
organisasi.
· Merlimpahnya
data ini merupakan akumulasi data transaksi yang terekam bertahun-tahun..
· Data–data
tersebut merupakan data transaksi yang umumnya diproses menggunakan aplikasi
komputer yang biasa disebut dengan OLTP (On Line Transaction Processing).
Manfaat penggunaan
datamining
Dari sudut pandang komersial,
pemanfaatan dataming dapat digunakan dalam menangani meledaknya volume data. Bagaimana mana menyimpannya, mengestraknya serta memanfaaatkannya. Berbagai teknik komputasi dapat digunakan menghasilkan informasi yang dibutuhkan. Informasi yang dihasilkan menjadi asset untuk meningkatkan daya saing suatu institusi. Data mining tidak hanya digunakan untuk menangani persoalan menumpuknya data/informasi dan bagaimana menggudangkannya tanpa kehilangan informasi yang penting (warehousing). Data mining juga diperlukan untuk menyelesaikan permasalahan atau menjawab kebutuhan bisnis itu sendiri, misalnya:
Dari sudut pandang komersial,
pemanfaatan dataming dapat digunakan dalam menangani meledaknya volume data. Bagaimana mana menyimpannya, mengestraknya serta memanfaaatkannya. Berbagai teknik komputasi dapat digunakan menghasilkan informasi yang dibutuhkan. Informasi yang dihasilkan menjadi asset untuk meningkatkan daya saing suatu institusi. Data mining tidak hanya digunakan untuk menangani persoalan menumpuknya data/informasi dan bagaimana menggudangkannya tanpa kehilangan informasi yang penting (warehousing). Data mining juga diperlukan untuk menyelesaikan permasalahan atau menjawab kebutuhan bisnis itu sendiri, misalnya:
· Bagaimana
mengetahui hilangnya pelanggan karena pesaing
· Bagaimana
mengetahui item produk atau konsumen yang memiliki kesamaan karakteristik
· Bagaimana
mengidentifikasi produk-produk yang terjual bersamaan dengan produk lain.
· Bagaimana
memprediski tingkat penjualan
· Bagaimana
menilai tingkat resiko dalam menentukan jumlah produksi suatu item.
· Bagaimana
memprediksi prilaku bisnis di masa yang akan datang
· Remote
sensor yang ditempatkan pada suatu satelit
· Telescope
yang digunakan untuk memindai langit
· Simulasi
saintifik yang membangkitkan data dalam ukuran terabytes
Pengertian
datamining
Dari sudut pandang keilmuan
data mining dapat digunakan untuk mengcapture, menganlisis serta menyimpan data yang bersifat real-time dan sangat besar, misalnya:
data mining dapat digunakan untuk mengcapture, menganlisis serta menyimpan data yang bersifat real-time dan sangat besar, misalnya:
Manfaat secara singkat
tahap KDD?
KDD adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti. Serangkaian proses tersebut yang memiliki tahap sebagai berikut
Pembersihan data dan integrasi data (cleaning and integration)
Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basisdata yang mungkin berbeda format maupun platform yang kemudian diintegrasikan dalam satu database datawarehouse.
KDD adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti. Serangkaian proses tersebut yang memiliki tahap sebagai berikut
Pembersihan data dan integrasi data (cleaning and integration)
Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basisdata yang mungkin berbeda format maupun platform yang kemudian diintegrasikan dalam satu database datawarehouse.
Berbagai metode seleksi
· Sampling,
adalah seleksi subset representatif dari populasi data yang besar.
· Denoising,
adalah proses menghilangkan noise dari data yang akan ditransformasikan
· Feature
extraction, adalah proses membuka spesifikasi data yang signifikan dalam
konteks tertentu.
Berbagai metode
transformasi
· Centering,
mengurangi setiap data dengan rata-rata dari setiap atribut yang ada.
· Normalisation,
membagi setiap data yang dicentering dengan standar deviasi dari atribut
bersangkutan.
· Scaling,
mengubah data sehingga berada dalam skala tertentu.
Pengertian datamining
4 fungsi yang umum
diterapkan dalam datamining
· Assosiation,
adalah proses untuk menemukan aturan assosiatif antarasuatu kombinasi item
dalam suatu waktu
· Secuence,
hampir sama dengan association bedanya seccuencediterapkan lebih dari satu
periode.
· Clastering,
adalah proses pengelompokan sejumlah data/obyek kedalam kelompok-kelompok data
(klaster) sehingga setiap klaster akanberisi data yang saling mirip.
· Classification,
adalah proses penemuan model atau fungsi yangmenjelaskan atau membedakan konsep
atau kelas data, dengan tujuanuntuk dapat memperkirakan kelas dari suatu objek
yang labelnya tidakdiketahui.
Penerapan
Datamining dalam kehidupan Sehari-hari
1. Analisa pasar dan
manajemen.
Solusi yang dapat diselesaikan dengan data mining, diantaranya: Menembak target pasar, Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil Customer, Identifikasi kebutuhan Customer, Menilai loyalitas Customer, Informasi Summary.
Solusi yang dapat diselesaikan dengan data mining, diantaranya: Menembak target pasar, Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil Customer, Identifikasi kebutuhan Customer, Menilai loyalitas Customer, Informasi Summary.
2.
Analisa Perusahaan dan Manajemen resiko.
Solusi yang dapat diselesaikan dengan data mining, diantaranya: Perencanaan keuangan dan Evaluasi aset, Perencanaan sumber daya (Resource Planning), Persaingan (Competition).
Solusi yang dapat diselesaikan dengan data mining, diantaranya: Perencanaan keuangan dan Evaluasi aset, Perencanaan sumber daya (Resource Planning), Persaingan (Competition).
3.
Telekomunikasi.
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual.
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual.
4. Keuangan.
Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry) .
Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry) .
5. Asuransi.
Australian Health Insurance
Commision menggunakan data mining untuk mengidentifikasi layanan
kesehatan yang sebenarnya
tidak perlu tetapi tetap dilakukan oleh peserta asuransi .
6. Olahraga.
IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim New York Knicks dan Miami Heat.
7. Astronomi.
Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa.
8. Internet Web surf-aid
IBM Surf-Aid menggunakan
algoritma data mining untuk mendata akses halaman Web khususnya yang berkaitan
dengan pemasaran guna melihat prilaku dan minat customer serta melihat ke-
efektif-an pemasaran melalui Web.
Bermanfaat sob,.
BalasHapusmampir ketempatku ya
www.cobacoba-tutorial.blogspot.com