ABSTRAK :
Plagiarisme adalah tindakan mengambil karangan atau karya orang lain,
dan mengakuinya sebagai karya sendiri. Plagiarisme terhadap teks sangat sering
terjadi dan sulit untuk dihindari. Oleh sebab itu, sudah banyak diciptakan suatu
sistem yang dapat membantu dalam melakukan deteksi plagiarisme dokumen teks.
Untuk melakukan pendeteksian plagiarisme dokumen teks pada intinya adalah
dengan melakukan pencocokan string. Hal tersebut membuat munculnya ide
untuk membangun sebuah Algoritma RTG24 yang akan diterapkan dalam aplikasi
Komparasi File.TXT. Dokumen yang akan dibandingkan harus berupa file .txt
atau plaintext, dan setiap kata yang terdapat dalam dokumen harus terdapat dalam
kamus besar bahasa Indonesia. Algoritma RTG24 bekerja dengan menentukan
banyaknya kata yang sama atau mirip pada tiap teks antara dua dokumen. Dalam
prosesnya Algoritma RTG24 memiliki beberapa tahap yaitu parsing, filtering,
stemming dan komparasi. Tahap parsing adalah tahap dimana setiap kalimat
dalam dokumen akan dipecah menjadi kata dasar, tahap filtering adalah
pembersihan partikel-partikel kata yang tidak penting, selanjutnya tahap stemming
yaitu tahap dimana setiap kata dicari kata dasarnya atau root kata,hal ini dilakukan
untuk menyederhakan dan memudahkan perbandingan antar kedua dokumen.
Setelah melewati proses parsing, filtering, dan stemming, dokumen kemudian di
masukkan kedalam array untuk proses komparasi atau perbandingan antara kedua
dokumen. Sehingga dapat ditentukan persentase tingkat kemiripan antara kedua
dokumen.
Kata Kunci : Algoritma RTG24,Komparasi File.TXT, Similaritas
|