KMeans untuk Pengklasteran dengan R

Metode pengklasteran merupakan salah satu metode pembelajaran mesin yang cukup matang dan paling umum digunakan dalam melakukan eksplorasi data. Tanpa mengetahui apapun mengenai data, kita dapat mengelompokkan data berdasarkan nilai masing-masing variabel. Salah satu algoritma yang digunakan adalah KMeans yang dalam R ada dalam paket stats.

Untuk menerapkan K-Means, ada beberapa hal yang perlu diperhatikan dalam menggunakan algoritma ini dengan R.

Argumen Fungsi KMeans

Berikut argumen yang diperlukan dalam menjalankan fungsi ini.

kmeans(x, centers, iter.max = 10, nstart = 1,
       algorithm = c("Hartigan-Wong", "Lloyd", "Forgy",
                     "MacQueen"), trace=FALSE)
## S3 method for class 'kmeans'
fitted(object, method = c("centers", "classes"), ...)

Dimana x adalah data yang ingin diklaster, centers adalah jumlah titik pusat, iter.max adalah jumlah maksimum pengulangan/iterasi, nstart adalah jumlah titik awal acak yang dibuat, algorithm adalah algoritma yang ingin dipakai, trace adalah opsi untuk informasi proses penghitungan.

Algoritma KMeans

Algoritma dasar kmeans adalah:

Continue reading “KMeans untuk Pengklasteran dengan R”