Dewasa ini arus informasi berkembang pesat di dalam dunia pendidikan, khususnya dalam proses pembelajaran. Mahasiswa tingkat akhir membutuhkan informasi mengenai penelitian yang sudah ada dan dipublikasikan, yang memiliki tingkat kemiripan paling tinggi dengan penelitian yang akan diajukan oleh mahasiswa tersebut. Hal ini dimaksudkan untuk menghindari tindak plagiarisme pada penelitian yang sudah ada. Penelitian ini mengembangkan sebuah perangkat lunak yang dapat digunakan untuk menentukan kemiripan topik proyek akhir berdasarkan abstrak pada jurusan Teknik Informatika, dengan tujuan agar proses penentuan kemiripan tersebut menjadi lebih mudah mengingat banyaknya penelitian di Politeknik Elektronika Negeri Surabaya. Data yang digunakan untuk membentuk metadata clustering dalam penelitian ini adalah dokumen proyek akhir Teknik Informatika dari tahun 2006 hingga 2011. Penelitian ini mengimplementasikan average linkage hierarchical clustering untuk mengelompokkan kumpulan dokumen proyek akhir menjadi sembilan bidang dan Inner Product untuk menentukan similaritas. Hasil pengujian sistem terhadap 50 input judul dan abstrak yang berbeda, menghasilkan tiga judul yang memiliki tingkat similaritas paling tinggi dimana prosentase error sebesar 0% pada judul ke-1, prosentase error sebesar 14% pada judul ke-2, dan prosentase error sebesar 24% pada judul ke-3.

wpChatIcon
EnglishIndonesian