research centers


Search results: Found 1

Listing 1 - 1 of 1
Sort by

Article
Modified Light Stemming Algorithm for Arabic Language
الخوارزمية المعدلة لاستعادة الجذور في اللغة العربية

Author: Rafal Ali Sameer رفل علي سمير
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2016 Volume: 57 Issue: 1B Pages: 507-513
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Stemming is a pre-processing step in Text mining applications as well as it is very important in most of the Information Retrieval systems. The goal of stemming is to reduce different grammatical forms of a word and sometimes derivationally related forms of a word to a common base (root or stem) form like reducing noun, adjective, verb, adverb etc. to its base form. The stem needs not to be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root. As in other languages; there is a need for an effective stemming algorithm for the indexing and retrieval of Arabic documents while the Arabic stemming algorithms are not widely available. The current algorithm will perform preprocessing operations then matches the result word to Arabic patterns to get the stem of the word. This paper proposed a modified light stemming algorithm for Arabic Languages. As shown from the results, the proposed algorithm is an efficient algorithm.

استعادة الجذر هي خطوة معالجة مسبقة في تطبيقات استخراج اصول الكلمات وكذلك تعد ذات اهمية كبيرة في معظم انظمة استرجاع المعلومات. الهدف من استعادة الجذر هو تقليل الصيغ النحوية المختلفة للكلمة واحيانا صيغ الاشتقاق للكلمة الى صيغة الاساس (جذر او اصل) الكلمة، مثل استرجاع الاسم، الصفة، الظرف، الفعل الى الاصل الذي جاءت منه. الجذر لايكون بالضرورة مطابق للجذر النحوي للكلمة، عادة يكفي ان الكلمات ذات الصلة تؤدي الى نفس الجذر حتى لو كان هذا الجذر ليس الجذر الصحيح. كما في بقية اللغات نحتاج الى خوارزمية فعالة لفهرسة واسترجاع النصوص باللغة العربية حيث ان خوارزميات استعادة الجذور باللغة العربية لاتتوفر بصورة واسعة. في هذه الخوارزمية سوف نحتاج الى معالجة مسبقة للكلمات العربية ثم نقارن الكلمة الناتجة مع مجموعة من صيغ الكلمات العربية لاسترجاع جذر الكلمة. في هذا البحث عدلت خوارزمية استعادة الجذور واثبتت النتائج كفاءة هذه الخوارزمية.

Listing 1 - 1 of 1
Sort by
Narrow your search

Resource type

article (1)


Language

English (1)


Year
From To Submit

2016 (1)