research centers


Search results: Found 4

Listing 1 - 4 of 4
Sort by

Article
A Proposed Method for Documents Indexing
طريقة مقترحة لفهرسة الوثائق

Authors: Alia Karim Abdul Hassan علياء كريم عبد الحسن --- Duaa Enteesha mhawi دعاء نتيشة مهاوي
Journal: Diyala Journal For Pure Science مجلة ديالى للعلوم الصرفة ISSN: 83732222 25189255 Year: 2017 Volume: 13 Issue: 2 - part 1 Pages: 43-56
Publisher: Diyala University جامعة ديالى

Loading...
Loading...
Abstract

In this paper, a new method is proposed for documents indexing based on constructing two tables, namely, words-information table and pages-information table. These two tables used to represent the first step in information retrieval (which prepare the documents set (preprocessing)). In Information retrieval systems, tokenization is an integrals part whose prime objective is to identifying the tokens and their count. In this paper, can be proposed an effective tokenization approach, which is based on proposed new method called documents indexing and results shows that efficiency of proposed algorithm. Tokenization on documents helps to satisfy user’s information need more precisely and reduced search sharply. Preprocessing of input document is an integral part of Tokenization, which involves preprocessing of documents and generates its respective tokens, which is the basis of these tokens. Probabilistic IR generate its scoring and gives reduced search space. Comparative analysis based on the two parameters; reduce the time of search space, Pre-processing time, and reduce the size of memory.

في هذه الورقة البحثية تم اقتراح طريقة جديده لفهرسة الوثائق والتي تستخدم لتمثيل الخطوة الاولى في استرجاع المعلومات (التي تحضر مجموعه الوثائق (عمليات مسبقة))، في أنظمة استرجاع المعلومات، التقطيع هو جزء تكاملي الذي يحدد الهدف من الرمز وحسابه، في هذه الورقة البحثية نستطيع ان نقترح خطوات تقطيع كفؤه مبنيه على أساس اقتراح طريقه جديده تسمى فهرسة الوثائق والنتائج تبين تلك الكفاءة للطريقة المطورة. تقطيع الوثائق يساعد ليلبي حاجه مستخدم المعلومات ويقلل فضاء البحث. اعاده معالجة الوثائق الداخلة هي جزء تكاملي لعمليه التقطيع، التي تتطلب اعاده معالجه للوثائق وتوليد رمز مطلوب الذي يعتبر أساس لهذا التقطيع. احتمالية استرجاع المعلومات تولد بدرجه وتعطي تقليل لفضاء البحث. مقارنة التحليل مبنيه على عاملين: تقليل فضاء البحث والوقت في اعاده المعالجة وتقليل من حجم الذاكرة.


Article
Proposed Handwriting Arabic Words classification Based On Discrete Wavelet Transform and Support Vector Machine
مقترح مصنف للكلمات العربية المكتوبة بخط اليد بالاعتماد على تقنية محول المويجات المتقطعة ( ( DWTوآلة داعم المتجهات SVM

Authors: Alia Karim Abdul Hassan علياء كريم عبد الحسن --- Mohammed Alawi محمد علاوي عباس
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2017 Volume: 58 Issue: 2C Pages: 1159-1168
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

A proposed feature extraction algorithm for handwriting Arabic words. The proposed method uses a 4 levels discrete wavelet transform (DWT) on binary image. sliding window on wavelet space and computes the stander derivation for each window. The extracted features were classified with multiple Support Vector Machine (SVM) classifiers. The proposed method simulated with a proposed data set from different writers. The experimental results of the simulation show 94.44% recognition rate.

تم اقتراح خوارزمية لاستخراج الصفات من الكلمات العربية المكتوبة بخط اليد. تستخدم الطريقة المقترحة التحويل الموجي (DWT) على الصورة ثنائية، بعد ذلك تم مسح الصورة ذات التحويل الموجي باستخدام نافذة ، ومن ثم يتم حساب قيمة الانحراف المعياري لكل نافذة . تم تصنيف الميزات المستخرجة بواسطة المصنفات SVMs . تم اقتراح قاعدة بيانات جديدة كتبت من قبل عدد مختلف من الكتاب .وهذة القاعدة تم استخدامها لاختبار العمل القترح وان النتائج التجريبية للنظام اظهرت معدل تميز 94.44٪.


Article
Automatic Query Expansion for Arabic Text Retrieval
توسيع الاستعلام التلقائي لاسترجاع النص العربي

Authors: Alia Karim Abdul Hassan علياء كريم عبد الحسن --- Mustafa Jasim Hadi مصطفى جاسم هادي
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2017 Volume: 58 Issue: 4c Pages: 2447-2457
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Query expansion (QE) is a successful idea to overcome the weaknesses in the information retrieval performance. The QE requires finding out appropriate word synonyms of the query words in a process that can be made automatically without any user intervention. The candidate synonyms should be associated with an accurate meaning (sense) of the original word. Arabic language is rich in multiple meanings and this requires using the so-called word sense disambiguation (WSD). WSD in general is a task to discover the correct sense of a word within context. To disambiguate the word sense, three different traditional semantic measures are tested in this work; they are called lch, wup, and path respectively. The proposed system uses these measures along with an automatic synonym selection method employed to expand the query. The proposed system outperforms the traditional baseline system that has no query expansion technique in a rate from 10% to 18 % and reduces the latency in an approximate rate from 0.232 to 0.283 second for each query.

توسيع الاستعلام (QE) هو فكرة ناجحة للتغلب على نقاط الضعف في أداء استرجاع المعلومات. يتطلب QE إيجاد مرادفات مناسبة لكلمات الاستعلام في عملية يمكن إجراؤها تلقائيا دون تدخل المستخدم. يجب أن ترتبط المرادفات المرشحة بمعنى دقيق (حس) للكلمة الأصلية. اللغة العربية غنية بمعاني متعددة وهذا يتطلب استخدام ما يسمى بإزالة الغموض عن المعنى (WSD). WSD بشكل عام هو مهمة لاكتشاف المعنى الصحيح للكلمة ضمن السياق. لإزالة الغموض عن معنى كلمة، يتم اختبار ثلاثة مقاييس دلالية تقليدية مختلفة في هذا العمل تدعى بـ lch ، wup , و path على التوالي. يستخدم النظام المقترح هذه المقاييس جنبا إلى جنب مع طريقة اختيار المرادفات التلقائية المستخدمة لتوسيع الاستعلام. يتفوق النظام المقترح على نظام خط الأساس التقليدي الذي ليس لديه تقنية توسيع بمعدل من 10٪ إلى 18٪ ويقلل من التأخير بمعدل تقريبي من 0.232 إلى 0.283 ثانية لكل استعلام.


Article
Information Retrieval using Modified Genetic Algorithm
إسترجاع المعلومات باستخدام الخوارزمية الجينية المُحَدَّثة

Authors: Alia Karim Abdul Hassan علياء كريم عبد الحسن --- Duaa Enteesha mhawi دعاء نتيشة مهاوي --- Sarah Najm Abdulwahid سارة نجم عبد الواحد
Journal: AL-MANSOUR JOURNAL مجلة المنصور ISSN: 18196489 Year: 2017 Issue: 27 Pages: 15-35
Publisher: Private Mansour college كلية المنصور الاهلية

Loading...
Loading...
Abstract

Several techniques proposed to retrieve the most relevant HTML documents to user query. Genetic algorithm (GA) one of these technique, which creates several generations iteratively using the operations of: selection, crossover and mutation before producing the results. In this paper, focuses on enhance the operations of GA and proposed new fitness function to enhance the quality of the retrieved results. This technique applied to HTML documents and using recall, precision measures to evaluate. The results show high improvement in the retrieved documents quality in terms of these measures.

المستخلصالعديد من التقنيات تم اقتراحها لغرض استرجاع وثائق HTML المطلوبة من قبل المستخدم. الخوارزمية الجينية تعتبر واحدة من هذه التقنيات والتي تعمل على خلق عدة اجيال بواسطة استخدام عمليات الاختيار، التزاوج والطفرة الوراثية لانتاج النتائج. في هذا البحث تم التركيز على تحسين عمليات الخوارزمية الجينية واقتراح دالة مفاضلة جديدة لغرض تحسين نوعية الوثائق المسترجعة. هذه التقنية المقترحة تمتطبيقها على وثائق HTML وتم استخدام مقاييس مثل اعادة الاستدعاء والدقة لغرض تقييم هذه التقنية المقترحة . هذا وقد اظهرت النتائج درجة عالية من التحسن في نوعية الوثائق المسترجعة من خلال هذه المقايس التي تم استخدامها

Listing 1 - 4 of 4
Sort by
Narrow your search

Resource type

article (4)


Language

English (2)

Arabic and English (1)


Year
From To Submit

2017 (4)