Klasifikasi Newsgroup Menggunakan Vector Space Model dan Novel K Nearest Neighbors

Mira Suryani, Ayi Muhammad Iqbal Nasuha, Intan Nurma Yulita, erick paulus

Abstrak


Salah satu penelitian dalam bidang perolehan informasi yang hingga saat ini masih menjadi kajian adalah kategorisasi teks. Klasifikasi teks dapat membantu manusia untuk menemukan sekumpulan informasi yang relevan sesuai dengan kebutuhan secara cepat. Studi ini mengemukakan tentang proses mengkategorisasikan newsgroup. Data newsgroup dipilih sebagai dataset penelitian dikarenakan newsgroup sendiri merupakan aplikasi yang telah lama dan banyak digunakan oleh orang untuk berdiskusi di dunia maya, sehingga data newsgroup berada dalam jumlah besar dan perlu pengelolaan. Vector space model sebagai representasi fitur dari sebuah dokumen yang dihasilkan setelah melalui proses indexing dan pembobotan menggunakan term frequency. Representasi fitur kemudian diklasifikasikan ke dalam 3 kategori sesuai dengan kelas kategorinya. Dari hasil penelitian diperoleh nilai rata-rata precision sebesar 71% dengan jumlah data yang diklasifikasikan secara benar sebanyak 89 data. Hasil ini diperoleh dari penentuan jumlah k paling optimal yang berada pada nilai 30.

Kata Kunci


klasifikasi; knn; newsgroup; term-frequency; vector space model

Teks Lengkap:

PDF


DOI: https://doi.org/10.24198/jin.v1i1.10994

Refbacks

  • Saat ini tidak ada refbacks.


Jumlah Pengunjung : website statistics

Creative Commons License


Jurnal Informatika Univeristas Padjadjaran is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.