research centers


Search results: Found 4

Listing 1 - 4 of 4
Sort by

Article
New Arabic Stemming based on Arabic Patterns
ايجاد جذور الكلمات العربية بالاعتماد على التفعيلات

Author: Rafea Mohammed رافع محمد
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2016 Volume: 57 Issue: 3C Pages: 2324-2330
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Algorithms for Arabic stemming available in two main types which are root-based approach and stem-based approach. Both types have problems which have been solved in the proposed stemmer which combined rules of both main types and based on Arabic patterns (Tafealat1) to find the added letters. The proposed stemmer achieved root exploration ratio (99.08) and fault ratio (0.9).

الخوارزميات العربية لايجاد الجذور متوفرة بنوعين رئيسيين هما النهج قائم على الجذر و النهج القائم على الجذع. كلا النوعين لهما مشاكل و التي حُلت في محلل الجذوع المقترح الذي يجمع بين قواعد كلا النوعين واعتمادا على تفعيلات اللغة العربية التي تساعد في ايجاد الحروف المضافة على الكلمة. حقق محلل الجذوع المقترح نسبة اكتشاف جذر (99.08) ونسبة خطأ (0.9).


Article
New Root-based Stemmer for Arabic Language
محلل جديد للجذوع المعتمد على الجذر الجديد للغة العربية

Author: Inas Ali ايناس علي
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2016 Volume: 57 Issue: 4B Pages: 2760-2766
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Importance of Arabic language stemming algorithm is not less than that of other languages stemming in Information Retrieval (IR) field. Lots of algorithms for finding the Arabic root are available and they are mainly categorized under two approaches which are light (stem)-based approach and root-based approach. The latter approach is somehow better than the first approach. A new root-based stemmer is proposed and its performance is compared with Khoja stemmer which is the most efficient root-based stemmers. The accuracy ratio of the proposed stemmer is (99.7) with a difference (1.9) with Khoja stemmer.

اهمية خوارزميات ايجاد الجذور للغة العربية ليست اقل من أهمية خوارزميات ايجاد الجذور للغات الاخرى في مجال استرجاع المعلومات. عدة خوارزميات لإيجاد الجذر العربي متوفرة وهي تصنف بشكل رئيسي تحت نهجين هما النهج المعتمد على الجذر والنهج المعتمد على الجذع. النهج الثاني هو الافضل نوعا ما من النهج الاول. تم اقتراح محلل الجذور المعتمد على الجذر الجديد وتمت مقارنة أدائه مع محلل جذور خوجة والذي يعد افضل محلل جذوع المعتمد على الجذر.نسبةالدقة للمحلل المقترحهي (99.7) مع فرق (1.9) مع محلل جذوع خوجة.


Article
Knowledge Acquisition & Hybrid Inference with a Stem-Based Approach (KISB)

Author: Abeer K. Al-Mashhsdany
Journal: Al-Nahrain Journal of Science مجلة النهرين للعلوم ISSN: (print)26635453,(online)26635461 Year: 2012 Volume: 15 Issue: 2 Pages: 169-183
Publisher: Al-Nahrain University جامعة النهرين

Loading...
Loading...
Abstract

The analysis of Arabic text is very important in works that require knowledge from the user. This work attempts to develop Arabic analyzer and then merge it with two modules; knowledge acquisition and hybrid inference. Each one of the two modules receives knowledge or part of knowledge (Arabic phrases) from many users. The knowledge acquisition system needs the Arabic analysis process to prevent: typing error and duplication. The hybrid inference system needs the Arabic analysis process: to prevent typing error, and to compute the probability of matching between the received premise and the stored one. In this work, the Arabic analyzer depends on stem-based approach. The results show that the Arabic analyzer is very effective in discovering: the wrong words and the similarity in meaning. To evaluate the proposed system, it was compared with another valued technique. And then, results of the comparison show that the proposed system have a lot of advantages over the traditionally shell technique.

إنّ تحليلَ النَصِّ العربيِ مهمُ جداً في أنواعِ الأنظمةِ التي تَتطلّبُ إدخال معرفة مِنْ المستخدمِ. هذا العملِ يَطور محلّلِ عربيِ وبعد ذلك يَدْمجُه بوحدتين: إستملاك المعرفةِ والإستدلالِ الهجينِ. تَستلمُ كل وحدة معرفة أَو جزءِ من المعرفةِ (عبارات عربية) مِنْ العديد مِنْ المستخدمين. وحدةُ إستملاكِ المعرفةَ تحتاج المحلّل العربيِ لمَنْع: الأخطاء الطِباعية وتكرار المعرفةِ. وحدةُ الإستدلالِ الهجينِ تحتاج المحلّل العربيِ: لمَنْع الأخطاء الطِباعية، ولحِساب إحتمالِ المُجَاراة بين العبارة المُستَلَمةِ والعبارات المَخْزُونة. في هذاالعملِ، يَعتمدُ المحلّل العربيَ على نظريةِ الجذعَ. توّضحُ النَتائِجَ بأنّ المحلّل العربيَ فعّالُ جداً في إكتِشاف: الكلمات الخاطئة والتشابه في المعنى. لتَقييم النظامِِ، تم مقُارنَته بتقنيةِ مقيّمةِ أخرى. وأوضَحَت نَتائِجَ المقارنةِ بأنّ هذا النظامَ لَهُ الكثير مِنْ الفوائدِ مقارنة بالتقنية الاخرى


Article
Root-Stem Approach in General Analyzer System for Arabic Language (RSGAS)
طريقة الجذر- الجذع في نظام المحلل العام للغة العربية

Loading...
Loading...
Abstract

Many application programs require knowledge from the user. In such programs, number of problems may occur. Problems related to natural language understanding such as; typos, duplication, similarity, and inconsistent knowledge. So, the analysis of text is very important in such programs. A previous work was done to solve problems of natural language understanding. That work build Arabic analyzer and merge it with a shell hybrid system. This work attempts to build a general Arabic Analyzer system, so that it could be merged with other programs to solve the natural language understanding problems. This work attempts to correct the previous Arabic analyzer, so its dictionary will be smaller. Morphology in this work merges root-based with stem-based approach. This merging forces this work because it gains the advantages of the two approaches. Root-based approach gives the advantage of smaller size. Stem-based approach gives the advantage of passing the problem of irregular cases. This work is compared with other two valued techniques. Results of the comparison show that this work has a lot of advantages over the previous techniques.

تتطلبالعديدمنالبرامجالتطبيقيةالمعرفةمنالمستخدم. فيمثلهذهالبرامج،قدتحدثعددمنالمشاكل. المشاكلذاتالصلةمعفهماللغةالطبيعيةمثل؛الأخطاءالمطبعية،والتكرار،والتشابه،والمعرفةغيرالمتناسقة. لذا،فإنتحليلالنصمهمجدافيمثلهذهالبرامج. تمانجاز عملسابقلحلمشاكلفهماللغةالطبيعية. ذلكالعملبنىمحللعربيودمجهمعنظامقشرةهجين. هذاالعمليحاولبناءنظاممحللعربيعام،بحيثيمكندمجهمعبرامجأخرىلحلمشاكلفهماللغة الطبيعية. هذاالعمليحاولتصحيحمحللالعربيةالسابق،لذلكسوفيكونلهقاموسأصغر. الصرففيهذاالعمليدمجالمستندةإلىالجذرمعالنهجالقائمعلىالجذعية. هذاالدمجيقويهذاالعمللأنهربحمزاياالنهجين. النهجالقائمعلىالجذريعطيميزةالحجمالأصغر. النهجالقائمعلىالجذعيةيعطيميزةاجتيازمشكلةالحالاتغيرالنظامية. تتممقارنةهذاالعملمعاثنينمنالتقنياتالأخرىالمقيمةسابقا. نتائجالمقارنةتبينأنهذاالعمللديهالكثيرمنالمزاياعلىالتقنياتالسابقة.

Listing 1 - 4 of 4
Sort by
Narrow your search

Resource type

article (4)


Language

English (4)


Year
From To Submit

2016 (3)

2012 (1)