research centers


Search results: Found 13

Listing 1 - 10 of 13 << page
of 2
>>
Sort by

Article
Enhance Inverted Index Using in Information Retrieval

Authors: Alia Karim Hassan --- Duaa Enteesha mhawi
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2016 Volume: 34 Issue: 2 Part (B) Scientific Pages: 302-310
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

This paper proposes a method to represent the first step in information retrieval (IR) (that prepare the document set (preprocessing), In Information retrieval systems, tokenization is an integral part whose prime objective is to identify the token and their count. In this paper, an effective tokenization approach which is based on proposed new method called enhance inverted index (EII). The result shows that efficiency/ effectiveness of the proposed algorithm. Tokenization on documents helps to satisfy user’s information need more precisely and reduced search sharply, believed to be a part of information retrieval. Pre-processing of input document is an integral part of Tokenization, which involves preprocessing of documents and generates its respective tokens, which is the basis of these tokens. Probabilistic IR generates its scoring and gives reduced search space. The comparative analysis based on the two parameters; reduce the time of search space, Pre-processing time


Article
Information Retrieval using Modified Genetic Algorithm
إسترجاع المعلومات باستخدام الخوارزمية الجينية المُحَدَّثة

Authors: Alia Karim Abdul Hassan علياء كريم عبد الحسن --- Duaa Enteesha mhawi دعاء نتيشة مهاوي --- Sarah Najm Abdulwahid سارة نجم عبد الواحد
Journal: AL-MANSOUR JOURNAL مجلة المنصور ISSN: 18196489 Year: 2017 Issue: 27 Pages: 15-35
Publisher: Private Mansour college كلية المنصور الاهلية

Loading...
Loading...
Abstract

Several techniques proposed to retrieve the most relevant HTML documents to user query. Genetic algorithm (GA) one of these technique, which creates several generations iteratively using the operations of: selection, crossover and mutation before producing the results. In this paper, focuses on enhance the operations of GA and proposed new fitness function to enhance the quality of the retrieved results. This technique applied to HTML documents and using recall, precision measures to evaluate. The results show high improvement in the retrieved documents quality in terms of these measures.

المستخلصالعديد من التقنيات تم اقتراحها لغرض استرجاع وثائق HTML المطلوبة من قبل المستخدم. الخوارزمية الجينية تعتبر واحدة من هذه التقنيات والتي تعمل على خلق عدة اجيال بواسطة استخدام عمليات الاختيار، التزاوج والطفرة الوراثية لانتاج النتائج. في هذا البحث تم التركيز على تحسين عمليات الخوارزمية الجينية واقتراح دالة مفاضلة جديدة لغرض تحسين نوعية الوثائق المسترجعة. هذه التقنية المقترحة تمتطبيقها على وثائق HTML وتم استخدام مقاييس مثل اعادة الاستدعاء والدقة لغرض تقييم هذه التقنية المقترحة . هذا وقد اظهرت النتائج درجة عالية من التحسن في نوعية الوثائق المسترجعة من خلال هذه المقايس التي تم استخدامها


Article
New Root-based Stemmer for Arabic Language
محلل جديد للجذوع المعتمد على الجذر الجديد للغة العربية

Author: Inas Ali ايناس علي
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2016 Volume: 57 Issue: 4B Pages: 2760-2766
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Importance of Arabic language stemming algorithm is not less than that of other languages stemming in Information Retrieval (IR) field. Lots of algorithms for finding the Arabic root are available and they are mainly categorized under two approaches which are light (stem)-based approach and root-based approach. The latter approach is somehow better than the first approach. A new root-based stemmer is proposed and its performance is compared with Khoja stemmer which is the most efficient root-based stemmers. The accuracy ratio of the proposed stemmer is (99.7) with a difference (1.9) with Khoja stemmer.

اهمية خوارزميات ايجاد الجذور للغة العربية ليست اقل من أهمية خوارزميات ايجاد الجذور للغات الاخرى في مجال استرجاع المعلومات. عدة خوارزميات لإيجاد الجذر العربي متوفرة وهي تصنف بشكل رئيسي تحت نهجين هما النهج المعتمد على الجذر والنهج المعتمد على الجذع. النهج الثاني هو الافضل نوعا ما من النهج الاول. تم اقتراح محلل الجذور المعتمد على الجذر الجديد وتمت مقارنة أدائه مع محلل جذور خوجة والذي يعد افضل محلل جذوع المعتمد على الجذر.نسبةالدقة للمحلل المقترحهي (99.7) مع فرق (1.9) مع محلل جذوع خوجة.


Article
A Proposed Method for Documents Indexing
طريقة مقترحة لفهرسة الوثائق

Authors: Alia Karim Abdul Hassan علياء كريم عبد الحسن --- Duaa Enteesha mhawi دعاء نتيشة مهاوي
Journal: Diyala Journal For Pure Science مجلة ديالى للعلوم الصرفة ISSN: 83732222 25189255 Year: 2017 Volume: 13 Issue: 2 - part 1 Pages: 43-56
Publisher: Diyala University جامعة ديالى

Loading...
Loading...
Abstract

In this paper, a new method is proposed for documents indexing based on constructing two tables, namely, words-information table and pages-information table. These two tables used to represent the first step in information retrieval (which prepare the documents set (preprocessing)). In Information retrieval systems, tokenization is an integrals part whose prime objective is to identifying the tokens and their count. In this paper, can be proposed an effective tokenization approach, which is based on proposed new method called documents indexing and results shows that efficiency of proposed algorithm. Tokenization on documents helps to satisfy user’s information need more precisely and reduced search sharply. Preprocessing of input document is an integral part of Tokenization, which involves preprocessing of documents and generates its respective tokens, which is the basis of these tokens. Probabilistic IR generate its scoring and gives reduced search space. Comparative analysis based on the two parameters; reduce the time of search space, Pre-processing time, and reduce the size of memory.

في هذه الورقة البحثية تم اقتراح طريقة جديده لفهرسة الوثائق والتي تستخدم لتمثيل الخطوة الاولى في استرجاع المعلومات (التي تحضر مجموعه الوثائق (عمليات مسبقة))، في أنظمة استرجاع المعلومات، التقطيع هو جزء تكاملي الذي يحدد الهدف من الرمز وحسابه، في هذه الورقة البحثية نستطيع ان نقترح خطوات تقطيع كفؤه مبنيه على أساس اقتراح طريقه جديده تسمى فهرسة الوثائق والنتائج تبين تلك الكفاءة للطريقة المطورة. تقطيع الوثائق يساعد ليلبي حاجه مستخدم المعلومات ويقلل فضاء البحث. اعاده معالجة الوثائق الداخلة هي جزء تكاملي لعمليه التقطيع، التي تتطلب اعاده معالجه للوثائق وتوليد رمز مطلوب الذي يعتبر أساس لهذا التقطيع. احتمالية استرجاع المعلومات تولد بدرجه وتعطي تقليل لفضاء البحث. مقارنة التحليل مبنيه على عاملين: تقليل فضاء البحث والوقت في اعاده المعالجة وتقليل من حجم الذاكرة.


Article
INTERNET SEARCH ENGINES SYSTEM FEATURES, OPERATORS AND COMPARISONS
محركات البحث المستخدمة في الانترنيت

Author: Maisaa Ibrahem Abdul-Hussain
Journal: AL-TAQANI مجلة التقني ISSN: 1818653X Year: 2011 Volume: 24 Issue: 8 Pages: E125-E132
Publisher: Foundation of technical education هيئة التعليم التقني

Loading...
Loading...
Abstract

Internet search engine is a program designed to help find information stored on a computer system such as the World Wide Web (WWW), or a personal computer. Millions of people around the world use i.nternet search engines and use regularly updated indexes to operate quickly and efficiently. Internet search engines work an attempt to match search query with the content of web pages that is has stored, or cached, and indexed on its powerful servers in advance of search. This paper presents a comparison between two of the most popular internet search engines Google and Yahoo according to the system features, time spend in search, number of results and percentage of world searches. Search results show that Google employs a number of techniques to improve search quality including pagerank and anchor text

محرك البحث في الأنترنيت عباره عن برنامج يصمم للمساعــده في ايجاد المعلومه المخزونه في نظــام الكومبيوتــر مثـل الشبكه العنكبوتيه العالميه (www) او اي حاسبه شخصيه. محركات البحث تستخدم من قبل ملايين الناس حول العالم وتستخدم نظام فهرسة محدث للعمل بسرعــه وكفاءه .عمل محركات البحث في الانترنيت محاولة لمطابقة الطلب مع محتوى صفحات الأنترنت المخزونة. هذا البحث يقدم نتائج المقارنة بين اثنين من اشهر محركات البحث Google وYahoo اعتمادا على خصائص النظام ,الوقت المستغرق,عدد النتائج والنسبة المئوية للبحث عالميا.تشير نتائج البحث ان Google يستخدم عدد من التقنيات لتحسين نوعية البحث تتضمن الpagerank ,anchor text)) مما يجعله افضل في مجال البحث والنتائج التي يظهرها


Article
Arabic stego_system based on Arabic Language structure and pronunciation
نظام اخفاء عربي بالاعتماد على قواعد وتلفظ اللغة العربیة

Authors: Ismael Abdulsattar اسماعیل عبد الستار جبار --- Naji M.Sahib ناجي مطر سحیب
Journal: AL-MANSOUR JOURNAL مجلة المنصور ISSN: 18196489 Year: 2013 Issue: 20 Pages: 161-169
Publisher: Private Mansour college كلية المنصور الاهلية

Loading...
Loading...
Abstract

Arabic language is the one of many languages that uses Harakat (damma, kas-ra,fat-ha, sukoon, tanween) or short vowel marks for the correct pronunciation that byhis turn will affect the meaning of the word. In this language each word has deferentmeaning based on the Harakat that can change the pronunciation. Harakat can beused on a single alphabet of these languages. We can write without them but theonly the Professional people can interpret the correct meaning of the sentence. Thusin this paper we code each one of these Harakat and then we use the sequence ofthis Harakat to obtain the correct sequence of the secret message and developingthe mechanism that can select the word with the proper Harakat that’s gives propermeaning based on huge database and provides mechanism also for high retrievalbased on the requirement of the secret message.

اللغة العربیة ھي واحدة من اللغات التي تستخدم الحركات (الضمھ, الفتحھ, الكسره ,السكون ,التنوین) او مایسطلح علىللحصول على نطق صحیح الذي بدوره یؤثر على معنى الكلمة حیث كل كلمة في (short vowel marks) تسمیتھاھذه اللغة تعطي عدة معاني بالاعتماد على الحركات التي تغیر النطق. الحركات یمكن ان تستخدم على كل حرف منالكلمة یمكن الكتابة بدونھا ولاكن فقط المحترفین یمكنھم تمیز المعنى الصحیح للجملة. ھكذا في ھذه الورقة البحثیة تمترمیز كل واحدة من حركات اللغة العربیة بحیث تستخدم سلسلة تتابع ھذه الحركات للحصول على تتابع صحیح منالرسالة السریة وتطویر میكانیكیة الحصول على الكلمات المناسبة التي تحوي على الحركات المطلوبة والحصول علىالمعنى المناسب بالاعتماد على قاعدة بیانات كبیرة.مع تزویدھا بمیكانیكیة عالیة الاسترجاع بالاعتماد على الرسالةالسریة.


Article
Artificial Bee Colony based Approach for Web Information Retrieval
طريقة معتمدة على مستعمرة النحل الاصطناعية لاجل استرجاع المعلومات في الويب

Authors: Hasanen S. Abdullah --- Mustafa J. Hadi
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2014 Volume: 32 Issue: 5 Part (B) Scientific Pages: 899-909
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

With the tremendous growth of information in the web, the classic query processing approaches are unable to respond to queries in real time. The aim of this paper is to develop an innovative tool using swarm intelligence to address information retrieval in the context of response time and solution quality through cope with the complexity induced by that huge volume of information. In this paper, we will show that our proposed approach that use of Artificial Bee Colony (ABC) algorithm called MABC can be another alternative to palliate the complexity issue in terms of response time while it produces a solution quality is relatively convergent or even better. Experimental tests have been conducted on two well-known CACM and NPL collections. Both are different in size, CACM is small while NPL is relatively large. Numerical results exhibit the superiority and the benefit gained from using the MABC approach instead of the classic approaches.

نتيجة للتزايد الهائل بالمعلومات الموجودة في الويب فان طرق معالجة الاستفسار التقليدية لم تعد قادرة على الاستجابة في الوقت الفعلي. الهدف من هذا البحث هو ايجاد طريقة بديلة باستخدام احدى خوارزميات التحشد الذكية لمعالجة استرجاع المعلومات في إطار الوقت اللازم لاجابة الاستفسار وجودة المعلومات من خلال التصدي للتعقيد الحاصل في الحجم الهائل في المعلومات. نحن سنبين في هذا البحث بان طريقتنا المقترحة التي تستخدم طريقة " مستعمرة النحل الاصطناعية" والتي تدعى "MABC" يمكن ان تكون بديلا عن الطرق التقليدية لتخفيف هذا التعقيد على صعيد الوقت اللازم لاستجابة الاستفسار بينما تنتج نوعية اجابة للمستخدم تكون متقاربة نسبيا مع الطرق التقليدية او حتى افضل منها . الاختبارات التجريبية تمت على مدونتين معروفة جيدا احدهما صغيرة هي " CACM" والاخرى كبيرة نسبيا هي "NPL". النتائج الرقمية تبين التفوق والربح الحاصل للطريقة المقترحة على الطرق التقليدية.


Article
Automated Arabic Essay Scoring (AAES) using Vector Space Model (VSM)
التقييم الالي للمقالات العربية باستخدام نموذج فضاء المتجهات (VSM)

Authors: Dr. Ayad R. Abbas د. ياد روضان عباس --- Ahmed S.Al-qaza احمد سعد القزاز
Journal: Journal Of AL-Turath University College مجلة كلية التراث الجامعة ISSN: 20745621 Year: 2014 Issue: 15 Pages: 25-39
Publisher: Heritage College كلية التراث الجامعة

Loading...
Loading...
Abstract

Automated Essays Scoring (AES) may be defined as the ability of computer technology to evaluate electronic essays written by learner according to previous determined essay.Researches and all the former works were applied to essays written in English language and they were applied to essays written in Hebrew, Bahasa Malay, Japanese, Chinese and Swedish. The research paper suggests an Automated Arabic Essays Scoring (AAES) system in web-based learning context based on Vector Space Model (VSM). The suggested system consists of two main processes. The first process deals with applying retrieval information to extract the important information from electronic essays. In the second process, the VSM is applied to find out the similarity degree between the previously written essays by the instructor and the essay written by the learner. The experimental results show that the proposed system provides an electronic assessment closer to instructors’ traditional assessment, leading to improve the learning’s efficiency, learning performance and to overcome time, cost and reliability.

التقييم الالي للمقالات (AES) هو قدرة تكنولوجيا الكمبيوتر على تقييم المقالات المكتوبة الكترونيا من قبل المتعلم وفقا لمقال محدد مسبقا. البحوث ومعظم الأعمال السابقة طبقت على مقالات مكتوبة باللغة الانكليزية، كما طبقت أيضا على مقالات كتبتباللغة العبرية، ولغة الباهاسا الماليزية، اليابانية، الصينية، السويدية. تقترح هذه الورقة نظام الي لتقييم المقالات المكتوبة باللغة العربية(AAES) في سياق التعلم القائم على الشبكة العالمية باستخدام نموذج فضاء المتجهات (VSM). يتكون النظام المقترح من عمليتين رئيسيتين. العملية الأولى يتم فيها تطبيق استرداد المعلومات لاستخراج المعلومات الهامة من مقالات الإلكترونية. الثانية، يتم تطبيق (VSM) للعثور على درجة التشابه بين المقالات المعدة مسبقا من قبل المعلم والمقالة المدخلة من قبل الطالب. النتائج التجريبية تبين أن النظام المقترح يوفر تقييما إلكترونيا قريب التقييم التقليدي للأستاذ، مما يؤدي إلى تحسين كفاءة التعلم والتغلب على عامل الوقت، التكلفة، والموثوقية.


Article
Automatic Query Expansion for Arabic Text Retrieval
توسيع الاستعلام التلقائي لاسترجاع النص العربي

Authors: Alia Karim Abdul Hassan علياء كريم عبد الحسن --- Mustafa Jasim Hadi مصطفى جاسم هادي
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2017 Volume: 58 Issue: 4c Pages: 2447-2457
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Query expansion (QE) is a successful idea to overcome the weaknesses in the information retrieval performance. The QE requires finding out appropriate word synonyms of the query words in a process that can be made automatically without any user intervention. The candidate synonyms should be associated with an accurate meaning (sense) of the original word. Arabic language is rich in multiple meanings and this requires using the so-called word sense disambiguation (WSD). WSD in general is a task to discover the correct sense of a word within context. To disambiguate the word sense, three different traditional semantic measures are tested in this work; they are called lch, wup, and path respectively. The proposed system uses these measures along with an automatic synonym selection method employed to expand the query. The proposed system outperforms the traditional baseline system that has no query expansion technique in a rate from 10% to 18 % and reduces the latency in an approximate rate from 0.232 to 0.283 second for each query.

توسيع الاستعلام (QE) هو فكرة ناجحة للتغلب على نقاط الضعف في أداء استرجاع المعلومات. يتطلب QE إيجاد مرادفات مناسبة لكلمات الاستعلام في عملية يمكن إجراؤها تلقائيا دون تدخل المستخدم. يجب أن ترتبط المرادفات المرشحة بمعنى دقيق (حس) للكلمة الأصلية. اللغة العربية غنية بمعاني متعددة وهذا يتطلب استخدام ما يسمى بإزالة الغموض عن المعنى (WSD). WSD بشكل عام هو مهمة لاكتشاف المعنى الصحيح للكلمة ضمن السياق. لإزالة الغموض عن معنى كلمة، يتم اختبار ثلاثة مقاييس دلالية تقليدية مختلفة في هذا العمل تدعى بـ lch ، wup , و path على التوالي. يستخدم النظام المقترح هذه المقاييس جنبا إلى جنب مع طريقة اختيار المرادفات التلقائية المستخدمة لتوسيع الاستعلام. يتفوق النظام المقترح على نظام خط الأساس التقليدي الذي ليس لديه تقنية توسيع بمعدل من 10٪ إلى 18٪ ويقلل من التأخير بمعدل تقريبي من 0.232 إلى 0.283 ثانية لكل استعلام.


Article
Distributed Information Retrieval Based On Metaheuristic Search and Query Expansion

Authors: Alia Karim Abdul Hassan --- Mustafa Jasim Hadi
Journal: Journal of Kufa for Mathematics and Computer مجلة الكوفة للرياضيات والحاسوب ISSN: 11712076 Year: 2017 Volume: 4 Issue: 3 Pages: 4-11
Publisher: University of Kufa جامعة الكوفة

Loading...
Loading...
Abstract

Distributed information retrieval (DIR) is a model enables a user to access many searchable databases reside in different locations. DIR is more complex than the centralized information retrieval (IR). It requires addressing two significant additional problems that are the resource selection and the results merging. Many techniques for addressing the two problems have been published in the literature. However, they still have a negative impact on retrieving quality and response time. This paper aims to improve the DIR efficiency through using a meta-heuristic algorithm and improving the result quality through a query expansion. The algorithm has been strengthened using the nearest neighbor graph in order to improve the search performance. The performance in the proposed system outperforms the one in the traditional system in a rate from 6% to 9% while reduces the latency in an approximate rate from 0.047 to 0.134 second for each query.

- استرجاع المعلومات الموزعة (DIR) هو نموذج يتيح للمستخدم الوصول إلى العديد من قواعد البيانات للبحث في مواقع مختلفة. DIR هو أكثر تعقيدا من استرجاع المعلومات المركزية (IR). فهو يتطلب معالجة مشكلتين إضافيتين هامتين هما اختيار الموارد ودمج النتائج. لقد نُشِرت العديد من التقنيات لمعالجة المشكلتين في الأدب. ومع ذلك، فإنها لا تزال لها تأثير سلبي على جودة الاسترجاع ووقت الاستجابة. تهدف هذه الورقة إلى تحسين كفاءة DIR من خلال استخدام خوارزمية ارشادية عليا معينة وتحسين جودة النتائج من خلال توسع الاستعلام. وقد تم تعزيز الخوارزمية باستخدام مخطط الجار الاقرب من أجل تحسين أداء البحث. أداء النظام المقترح يفوق الأداء في النظام التقليدي بمعدل من 6٪ إلى 9٪ في حين يقلل من التاخير بمعدل تقريبي من 0.047 إلى 0.134 ثانية لكل استعلام.

Listing 1 - 10 of 13 << page
of 2
>>
Sort by
Narrow your search

Resource type

article (13)


Language

English (10)

Arabic and English (2)

Arabic (1)


Year
From To Submit

2017 (5)

2016 (2)

2015 (1)

2014 (2)

2013 (2)

More...