ABSTRAK
Klasifikasi adalah proses pencarian sekumpulan model atau fungsi yang menggambarkan dan membedakan kelas data dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu obyek yang belum diketahui kelasnya. Dengan metode naïve bayes dokumen akan dikelompokkan berdasar nilai tertinggi probabilitasnya. Data dokumen yang digunakan adalah data hasil dari proses text mining pada dokumen. Dari percobaan yang dilakukan dengan 656 dokumen hasilnya memberikan kesimpulan bahwa pada umumnya pengklasifikasian dokumen dengan metode naive bayes dapat digunakan untuk mengelompokkan dokumen dengan tingkat akurasi yang tinggi 92.66% untuk dokumen dengan data contoh 50% dari 656 dokumen.
Kata kunci : Klasifikasi, naïve bayes, text mining
ABSTRACT
Classification is an investigation process of a group of models or a group of functions which describe and distinguish data classes in order that models can be used to predict the class of any unknown class object. Naïve bayes method grouped the documents based on the highest probability values. The document data which are used in naïve bayes method is an out put data from text mining process on documents. The result of experiment on 656 documents showed that naïve bayes method generally can be used for grouping the documents with high accurateness level (accurateness level is 92.66% with 50% sample data from 656 documents).
Key words: classification, naïve bayes, text mining.