Klasterisasi merupakan salah satu cara pengolahan data yang sering dilakukan. Salah satu metode klasterisasi secara statistik yang banyak digunakan adalah metode K-Means. Metode K-Means mempunyai kelebihan dalam menghasilkan klaster dengan proses yang cepat. Kelemahan metode K-Means adalah membangkitkan initial centroid secara acak sehingga klaster yang dihasilkan memungkinkan tidak optimal dan juga terbatas hanya pada data numerik saja. Masalah yang akhir-akhir ini sering timbul adalah ketika data yang akan diklasterisasi adalah data kategorikal, tidak memungkinkan bila kita juga menerapkan metode K-Means. Karena hal ini dapat menimbulkan hasil klasterisasi yang kacau bila tetap dilakukan dengan metode K-Means. Oleh karena itu proyek akhir ini dibuat untuk memudahkan dalam mengelompokkan data kategorikal berdasarkan pengembangan metode K-Means, yaitu metode K-Modes.
Metode K-Modes mempunyai beberapa kelebihan, yaitu bisa diterapkan untuk data kategorikal, dalam menghasilkan klaster prosesnya lebih rinci, waktu komputasi pembentukan klaster lebih singkat, dan unggul dalam klasterisasi pada data berdimensi banyak.
Pada percobaan yang telah dilakukan pada dataset Soybean Disease dan Wisconsin Breast Cancer rata-rata akurasi penempatan klaster diatas 80 %, sedangkan pada dataset Breast Cancer sebesar 60 %.