KLASIFIKASI ARTIKEL ONLINE TENTANG GEMPA DI INDONESIA MENGGUNAKAN MULTINOMIAL NAÏVE BAYES
Abstract
Indonesia merupakan negara yang rawan gempa bumi. Hal ini menyebabkan banyaknya pemberitaan tentang gempa bumi oleh berbagai media massa. Salah satu cara penyampaian informasi yang cukup populer adalah melalui artikel online. Artikel online tentang gempa bumi dapat dikelompokan ke dalam kategori ekonomi, kesehatan, dan pariwisata. Text classification dapat membantu proses klasifikasi artikel ini. Pada penelitian ini, dilakukan pengujian pada performa dari metode probabilistik multinomial Naïve Bayes dalam mengelompokan artikel online tentang gempa bumi di Indonesia. Pembobotan dilakukan dengan menggunakan teknik TF-IDF. Pengujian dilakukan dengan 2 jenis feature yaitu unigram dan bigram, serta penggabungan dari keduanya. Selain itu, pengujian juga dilakukan dengan menghilangkan stemming dan stopwords removal dari tahap preprocessing. F-measure tertinggi yang didapatkan adalah sebesar 95.20% yaitu pada skenario pengujian dengan menggabungkan feature unigram dan bigram serta melewati tahap stemming dan stopwords removal pada preprocessing.