Analisis Sentimen Produk Permainan Menggunakan Metode TF-IDF Dan Algoritma K-Nearest Neighbor
Dublin Core
Title
Analisis Sentimen Produk Permainan Menggunakan Metode TF-IDF Dan Algoritma K-Nearest Neighbor
Subject
Analisis Sentimen, TF-IDF, KNN, Case Folding, Tokenizing
Description
On online shopping sites, there is a comment or rating column from buyers who have made
transactions on the product. With the product rating feature based on this assessment, the
buyer can find out how good or bad the product. However, a problem arises where there are
some buyers who give negative comments with a five-star rating, this causes the product
rating feature based on ratings to be less good. Therefore, to determine the quality of the
product, sentiment analysis was carried out using the TF-IDF and K-Nearest Neighbor (KNN)
methods based on reviews from buyers. The data collected is 1000 reviews which are divided
into 700 training data and 300 test data. The next stage is preprocessing text such as case
folding (converting uppercase letters to lowercase), tokenizing (separating single word
sentences), stopwords (removing tokenizing conjunctions that have nothing to do with
sentiment analysis), stemming (changing words into basic word forms) and word weighting
with TF-IDF. The last stage is to classify using the K Nearest Neighbor (K-NN) method.
Based on the classification obtained an accuracy rate of 79.3333%.
CORRESPONDENCE
Phone: +62 85281834545
E-mail: rifki_kosasih@staff.gunadarma.ac.id
A B S T R A K
Pada situs belanja online, terdapat kolom komentar atau rating dari pembeli yang telah
melakukan transaksi pada produk tersebut. Dengan adanya fitur penilaian produk berdasarkan
rating tersebut, pihak pembeli dapat mengetahui seberapa baik atau buruknya produk tersebut.
Akan tetapi muncul permasalahan dimana ada beberapa pembeli memberikan komentar
negatif dengan rating sebesar lima bintang ataupun sebaliknya, hal tersebut menyebabkan fitur
penilaian produk berdasarkan rating menjadi kurang baik. Oleh karena itu untuk dapat
mengetahui kualitas produk tersebut dilakukan analisis sentimen dengan metode TF-IDF dan
K-Nearest Neighbor (KNN) berdasarkan ulasan dari pembeli. Data yang dikumpulkan adalah
1000 ulasan yang dibagi menjadi 700 data latih dan 300 data uji. Tahapan selanjutnya
dilakukan teks preprocessing seperti case folding (mengubah huruf besar menjadi kecil),
tokenizing (pemisahan kalimat menjadi kata tunggal), stopword (menghilangkan kata
sambung hasil tokenizing yang tidak ada hubungannya dalam analisis sentimen), stemming
(mengubah kata ke bentuk kata dasar) dan pembobotan kata dengan TF-IDF. Tahapan terakhir
adalah melakukan klasifikasi dengan menggunakan metode K Nearest Neighbor (K-NN).
Berdasarkan hasil klasifikasi diperoleh tingkat akurasi sebesar 79,3333%.
transactions on the product. With the product rating feature based on this assessment, the
buyer can find out how good or bad the product. However, a problem arises where there are
some buyers who give negative comments with a five-star rating, this causes the product
rating feature based on ratings to be less good. Therefore, to determine the quality of the
product, sentiment analysis was carried out using the TF-IDF and K-Nearest Neighbor (KNN)
methods based on reviews from buyers. The data collected is 1000 reviews which are divided
into 700 training data and 300 test data. The next stage is preprocessing text such as case
folding (converting uppercase letters to lowercase), tokenizing (separating single word
sentences), stopwords (removing tokenizing conjunctions that have nothing to do with
sentiment analysis), stemming (changing words into basic word forms) and word weighting
with TF-IDF. The last stage is to classify using the K Nearest Neighbor (K-NN) method.
Based on the classification obtained an accuracy rate of 79.3333%.
CORRESPONDENCE
Phone: +62 85281834545
E-mail: rifki_kosasih@staff.gunadarma.ac.id
A B S T R A K
Pada situs belanja online, terdapat kolom komentar atau rating dari pembeli yang telah
melakukan transaksi pada produk tersebut. Dengan adanya fitur penilaian produk berdasarkan
rating tersebut, pihak pembeli dapat mengetahui seberapa baik atau buruknya produk tersebut.
Akan tetapi muncul permasalahan dimana ada beberapa pembeli memberikan komentar
negatif dengan rating sebesar lima bintang ataupun sebaliknya, hal tersebut menyebabkan fitur
penilaian produk berdasarkan rating menjadi kurang baik. Oleh karena itu untuk dapat
mengetahui kualitas produk tersebut dilakukan analisis sentimen dengan metode TF-IDF dan
K-Nearest Neighbor (KNN) berdasarkan ulasan dari pembeli. Data yang dikumpulkan adalah
1000 ulasan yang dibagi menjadi 700 data latih dan 300 data uji. Tahapan selanjutnya
dilakukan teks preprocessing seperti case folding (mengubah huruf besar menjadi kecil),
tokenizing (pemisahan kalimat menjadi kata tunggal), stopword (menghilangkan kata
sambung hasil tokenizing yang tidak ada hubungannya dalam analisis sentimen), stemming
(mengubah kata ke bentuk kata dasar) dan pembobotan kata dengan TF-IDF. Tahapan terakhir
adalah melakukan klasifikasi dengan menggunakan metode K Nearest Neighbor (K-NN).
Berdasarkan hasil klasifikasi diperoleh tingkat akurasi sebesar 79,3333%.
Creator
Rifki Kosasih, Anggi Alberto
Publisher
Perpustakaan Horizon Karawang
Date
2021
Contributor
Fajar Bagus W
Format
PDF
Language
Indonesia
Type
Text
Files
Collection
Citation
Rifki Kosasih, Anggi Alberto, “Analisis Sentimen Produk Permainan Menggunakan Metode TF-IDF Dan Algoritma K-Nearest Neighbor,” Repository Horizon University Indonesia, accessed November 22, 2024, https://repository.horizon.ac.id/items/show/3362.