Algoritma Stemming Nazief & Andriani


Assalamu’alaikum,

Dear all,

Beberapa waktu lalu, alhamdulillah saya sudah menyelesaikan tesis saya. Tesis saya berkaitan dengan dunia data mining, text mining, dan information retrieval. Dalam pengerjaan tesis tersebut, ada salah satu proses dimana saya harus melakukan stemming. Stemming adalah tahap mencari akar kata dengan menghilangkan imbuhan-imbuhan yang terdapat pada sebuah kata.

Stemming

Ada beberapa algoritma stemming kata dalam Bahasa Indonesia yang cukup populer, diantaranya adalah Algoritma Porter dan Algoritma Nazief-Andriani. Berdasarkan penelitian yang dilakukan oleh Ledy Agusta, proses stemming dokumen teks berbahasa Indonesia menggunakan Algoritma Porter memiliki prosentase keakuratan (presisi) lebih kecil dibandingkan dengan stemming menggunakan Algoritma Nazief-Adriani.
Atas dasar itulah, saya memutuskan untuk menggunakan Algoritma Nazief-Adriani dalam penelitian saya. Untuk lebih detailnya, anda bisa langsung download source code Algoritma Nazief-Adriani di sini.
Ok, sekian, terimakasih.

Wassalamu’alaikum.

Regards,

Fathan

Advertisements

3 thoughts on “Algoritma Stemming Nazief & Andriani

  1. assalamualaikum wr.wb ukhti saya mau bertanya ? algoritma stemming itu kan itung rumusnya pakai matematika dan vektor, misalkan saya mau nerapin dalam kamus itu, dihitung lagi perkatanya atau rumus yang mutlak bisa di pakai berbagai jenis sprti kamus data sekola data perusahaan terimakasih

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s