research centers


Search results: Found 1

Listing 1 - 1 of 1
Sort by

Article
Automatic Query Expansion for Arabic Text Retrieval
توسيع الاستعلام التلقائي لاسترجاع النص العربي

Authors: Alia Karim Abdul Hassan علياء كريم عبد الحسن --- Mustafa Jasim Hadi مصطفى جاسم هادي
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2017 Volume: 58 Issue: 4c Pages: 2447-2457
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Query expansion (QE) is a successful idea to overcome the weaknesses in the information retrieval performance. The QE requires finding out appropriate word synonyms of the query words in a process that can be made automatically without any user intervention. The candidate synonyms should be associated with an accurate meaning (sense) of the original word. Arabic language is rich in multiple meanings and this requires using the so-called word sense disambiguation (WSD). WSD in general is a task to discover the correct sense of a word within context. To disambiguate the word sense, three different traditional semantic measures are tested in this work; they are called lch, wup, and path respectively. The proposed system uses these measures along with an automatic synonym selection method employed to expand the query. The proposed system outperforms the traditional baseline system that has no query expansion technique in a rate from 10% to 18 % and reduces the latency in an approximate rate from 0.232 to 0.283 second for each query.

توسيع الاستعلام (QE) هو فكرة ناجحة للتغلب على نقاط الضعف في أداء استرجاع المعلومات. يتطلب QE إيجاد مرادفات مناسبة لكلمات الاستعلام في عملية يمكن إجراؤها تلقائيا دون تدخل المستخدم. يجب أن ترتبط المرادفات المرشحة بمعنى دقيق (حس) للكلمة الأصلية. اللغة العربية غنية بمعاني متعددة وهذا يتطلب استخدام ما يسمى بإزالة الغموض عن المعنى (WSD). WSD بشكل عام هو مهمة لاكتشاف المعنى الصحيح للكلمة ضمن السياق. لإزالة الغموض عن معنى كلمة، يتم اختبار ثلاثة مقاييس دلالية تقليدية مختلفة في هذا العمل تدعى بـ lch ، wup , و path على التوالي. يستخدم النظام المقترح هذه المقاييس جنبا إلى جنب مع طريقة اختيار المرادفات التلقائية المستخدمة لتوسيع الاستعلام. يتفوق النظام المقترح على نظام خط الأساس التقليدي الذي ليس لديه تقنية توسيع بمعدل من 10٪ إلى 18٪ ويقلل من التأخير بمعدل تقريبي من 0.232 إلى 0.283 ثانية لكل استعلام.

Listing 1 - 1 of 1
Sort by
Narrow your search

Resource type

article (1)


Language

English (1)


Year
From To Submit

2017 (1)