ABSTRAK

Web mining untuk pencarian berdasarkan kata kunci dengan automatic clustering adalah suatu metode pencarian dokumen dengan cara mengelompokkan atau mengklaster dokumen dari dokumen-dokumen berdasarkan kata kuncinya. Selanjutnya dilakukan pengklasteran dengan metode Centroid Linkage Hierarchical Method (CLHM) terhadap jumlah kata kunci yang diperoleh dari masing-masing dokumen. Dalam pengklasteran, umumnya harus dilakukan inisialisasi jumlah cluster yang ingin dibentuk terlebih dahulu, padahal pada beberapa kasus pengklasteran, user bahkan tidak tahu berapa banyak cluster yang bisa dibangun. Untuk itu, dalam proyek akhir ini diaplikasikan metode Valley Tracing sebagai constraint yang akan melakukan identifikasi terhadap pergerakan varian dari tiap tahap pembentukan cluster dan menganalisa polanya untuk membentuk suatu cluster secara otomatis (automatic clustering).
Data dokumen yang digunakan adalah data hasil dari proses text mining pada dokumen. Dari percobaan yang dilakukan dengan 424 dokumen hasilnya memberikan kesimpulan bahwa pada umumnya pencarian dokumen dengan teknik pengklasteran dengan algoritma Centroid Linkage Hierarchical Method dapat digunakan untuk mengelompokkan dokumen dengan jumlah yang tepat secara otomatis.

Kata kunci : text mining, automatic clustering, Centroid Linkage Hierarchical Method, valley tracing.

wpChatIcon
EnglishIndonesian