research centers


Search results: Found 2

Listing 1 - 2 of 2
Sort by

Article
Automatic Query Expansion for Arabic Text Retrieval
توسيع الاستعلام التلقائي لاسترجاع النص العربي

Authors: Alia Karim Abdul Hassan علياء كريم عبد الحسن --- Mustafa Jasim Hadi مصطفى جاسم هادي
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2017 Volume: 58 Issue: 4c Pages: 2447-2457
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Query expansion (QE) is a successful idea to overcome the weaknesses in the information retrieval performance. The QE requires finding out appropriate word synonyms of the query words in a process that can be made automatically without any user intervention. The candidate synonyms should be associated with an accurate meaning (sense) of the original word. Arabic language is rich in multiple meanings and this requires using the so-called word sense disambiguation (WSD). WSD in general is a task to discover the correct sense of a word within context. To disambiguate the word sense, three different traditional semantic measures are tested in this work; they are called lch, wup, and path respectively. The proposed system uses these measures along with an automatic synonym selection method employed to expand the query. The proposed system outperforms the traditional baseline system that has no query expansion technique in a rate from 10% to 18 % and reduces the latency in an approximate rate from 0.232 to 0.283 second for each query.

توسيع الاستعلام (QE) هو فكرة ناجحة للتغلب على نقاط الضعف في أداء استرجاع المعلومات. يتطلب QE إيجاد مرادفات مناسبة لكلمات الاستعلام في عملية يمكن إجراؤها تلقائيا دون تدخل المستخدم. يجب أن ترتبط المرادفات المرشحة بمعنى دقيق (حس) للكلمة الأصلية. اللغة العربية غنية بمعاني متعددة وهذا يتطلب استخدام ما يسمى بإزالة الغموض عن المعنى (WSD). WSD بشكل عام هو مهمة لاكتشاف المعنى الصحيح للكلمة ضمن السياق. لإزالة الغموض عن معنى كلمة، يتم اختبار ثلاثة مقاييس دلالية تقليدية مختلفة في هذا العمل تدعى بـ lch ، wup , و path على التوالي. يستخدم النظام المقترح هذه المقاييس جنبا إلى جنب مع طريقة اختيار المرادفات التلقائية المستخدمة لتوسيع الاستعلام. يتفوق النظام المقترح على نظام خط الأساس التقليدي الذي ليس لديه تقنية توسيع بمعدل من 10٪ إلى 18٪ ويقلل من التأخير بمعدل تقريبي من 0.232 إلى 0.283 ثانية لكل استعلام.


Article
Distributed Information Retrieval Based On Metaheuristic Search and Query Expansion

Authors: Alia Karim Abdul Hassan --- Mustafa Jasim Hadi
Journal: Journal of Kufa for Mathematics and Computer مجلة الكوفة للرياضيات والحاسوب ISSN: 11712076 Year: 2017 Volume: 4 Issue: 3 Pages: 4-11
Publisher: University of Kufa جامعة الكوفة

Loading...
Loading...
Abstract

Distributed information retrieval (DIR) is a model enables a user to access many searchable databases reside in different locations. DIR is more complex than the centralized information retrieval (IR). It requires addressing two significant additional problems that are the resource selection and the results merging. Many techniques for addressing the two problems have been published in the literature. However, they still have a negative impact on retrieving quality and response time. This paper aims to improve the DIR efficiency through using a meta-heuristic algorithm and improving the result quality through a query expansion. The algorithm has been strengthened using the nearest neighbor graph in order to improve the search performance. The performance in the proposed system outperforms the one in the traditional system in a rate from 6% to 9% while reduces the latency in an approximate rate from 0.047 to 0.134 second for each query.

- استرجاع المعلومات الموزعة (DIR) هو نموذج يتيح للمستخدم الوصول إلى العديد من قواعد البيانات للبحث في مواقع مختلفة. DIR هو أكثر تعقيدا من استرجاع المعلومات المركزية (IR). فهو يتطلب معالجة مشكلتين إضافيتين هامتين هما اختيار الموارد ودمج النتائج. لقد نُشِرت العديد من التقنيات لمعالجة المشكلتين في الأدب. ومع ذلك، فإنها لا تزال لها تأثير سلبي على جودة الاسترجاع ووقت الاستجابة. تهدف هذه الورقة إلى تحسين كفاءة DIR من خلال استخدام خوارزمية ارشادية عليا معينة وتحسين جودة النتائج من خلال توسع الاستعلام. وقد تم تعزيز الخوارزمية باستخدام مخطط الجار الاقرب من أجل تحسين أداء البحث. أداء النظام المقترح يفوق الأداء في النظام التقليدي بمعدل من 6٪ إلى 9٪ في حين يقلل من التاخير بمعدل تقريبي من 0.047 إلى 0.134 ثانية لكل استعلام.

Listing 1 - 2 of 2
Sort by
Narrow your search

Resource type

article (2)


Language

English (2)


Year
From To Submit

2017 (2)