Sarana Informasi Bidang Informatika.

Metode K-Mean Clustering Data Mining

Pemahaman 

Algoritma K-means clustering adalah salah satu cara data clustering non-hirarki yang mengelompokan data berbentuk satu atau lebih Cluster/Grup.

Dalam K-Means clustering ada 2 type Klasifikasi yakni:

  1. Supervised classification 
  2. Unsupervised classification 


Clustering bisa dipandang yang sangat terpenting dalam permasalahan unsupervised learning.

Cara Metode Clustering 

Ada banyak cara atau jenis untuk lakukan clustering, diantaranya :

  1. Jenis connectivity 
  2. Jenis centroid 
  3. Jenis density 
  4. Jenis subspace 
  5. Jenis Group 
  6. Jenis graph based 


Algoritma k-means adalah jenis centroid. Jenis centroid ialah jenis yang memakai centroid untuk bikin cluster.

Centroid ialah "titik tengah" satu cluster. Centroid berbentuk nilai. Centroid dipakai untuk mengkalkulasi jarak satu objek data pada centroid.

Satu objek data termasuk juga pada suatu cluster bila mempunyai jarak terpendek pada centroid cluster itu. .

Peng Aplikasian 

Clustering algoritma bisa diaplikasikan dalam beberapa bagian,contohnya:

  • Perpustakaan 
  • Biologi 
  • Industri 
  • Pemasaran 
  • Asuransi 
  • Rencana kota 
  • Dan lain-lain 

Algoritma Aplikasi K-mean Clustering 

  1. Memastikan jumlahnya K Cluster 
  2. Jumlahnya cluster mesti lebih kecil daripada banyakya data (k < n) 
  3. Memastikan nilai centroid 
  4. Dalam memastikan nilai centroid dapat dikerjakan dengan beberapa langkah. Akan tetapi yang sangat seringkali dikerjakan ialah dengan langkah acak atau acak. 
  5. Mengkalkulasi jarak pada titik centroid dengan titik setiap objek 

Trans Konstruksi Data 

Cara K-Means Clustering cuma dapat memproses data berbentuk angka, jadi untuk data yang berupa nominal mesti di Inisialisasikan terlebih dulu berbentuk angka. Jalannya ialah :

Baca juga : pengujian black box dan pengujian white box beserta contohnya

Urutkan data berdasar pada frekwensi kehadirannya.
Inisialisasikan data itu dari mulai data paling tinggi dengan nilai 1, lalu data setelah itu 2, 3 serta Selanjutnya.