research centers


Search results: Found 2

Listing 1 - 2 of 2
Sort by

Article
Logo Detection in Arabic Documents Using Multi Smearing Method and Decision Tree
الكشف عن الشعار في الوثائق العربية باستخدام طريقة التلطيخ المتعدد وشجرة اتخاذ القرار

Authors: Matheel E.Abdulmunim مثيل عماد الدين عبدالمنعم --- Haithem K. Abass هيثم كريم عباس
Journal: AL-MANSOUR JOURNAL مجلة المنصور ISSN: 18196489 Year: 2017 Issue: 27 Pages: 1-14
Publisher: Private Mansour college كلية المنصور الاهلية

Loading...
Loading...
Abstract

The detection of logo techniques play significant role for document image analysis and retrieval. In this paper, an effective logo detection method in Arabic document images has been proposed. In the proposed technique different logos can be detected based on extracting features that will distinguish logo from other non-logo parts of document like text, graph, table, and also stamp. This model is divided into three main stages. The first stage is smearing stage, where the document image has been smeared in multi directions to segment image to different blocks represent foreground objects of document. The second stage is to extract appropriate and significant features from these blocks by bounding blocks into rectangles. The third stage is performing decision tree that consist of a number of rules that will be applied to block features to correctly classify logo from non-logo objects. The proposed technique overcome many problem of logo detection like logos that contains separated parts, logos with text, and logo with noise. This technique has been tested and evaluated on dataset containing variety of Arabic document images of different colors, shapes and resolutions. Experimental results exhibit its performance in detecting logos with 96% for accuracy and 98% for precision.

تلعب تقنيات الكشف عن الشعار دورا مؤثرا في عملية تحليل واسترجاع الوثائق المصورة. في هذا البحث تم اقتراح تقنية فعالة في الكشف عن الشعار في الوثائق العربية. حيث يمكن في هّذا الطريقة المقترحة الكشف عن انواع مختلفة من الشعارات بالاعتماد على استخراج الصفات والتي من خلالها يمكن تمييز الشعار من الاجزاء الاخرى للوثيقة مثل النص والرسم والجدول والختم. هذه التقنية تتكون من ثلاثة مراحل اساسية. المرحلة الاولى هي مرحلة التلطيخ باتجاهات متعددة للوثيقة لاجل تجزئة الصورة الى كتل تمثل الاشياء الامامية من الوثيقة. المرحلة الثانية هي لاجل استخراج الملامح المناسبة والمؤثرة من هذه الكتل بواسطة ربط الكتل على شكل مستطيلات. المرحلة الثالثة هي تنفيذ شجرة اتخاذ القرار التي تتكون من عدد من القواعد التي يتم تطبيق صفات الكتل عليها ليتم تصنيف الشعارعن الاجزاء الاخرى التي لاتمثل الشعار. في تقنية الكشف هذه تم التغلب على عدة مشاكل في الكشف عن الشعار منها الشعارات التي تحتوي على اجزاء منفصلة والشعارات التي تحتوي على نص وكذالك الشعارات المشوشة. تم اختبار وتقييم الطريقة المقترحة على مجموعة من البيانات التي تحتوي انواع مختلفة من الوثائق العربية المصورة بمختلف الالوان والاشكال والدقة. من خلال النتائج المستخلصة من التجارب لقياس كفائة التقنية فأن نسبة الصحة في الكشف عن الشعار كانت 96% بينما نسبة الدقة كانت 98%.


Article
A New Adaptive Method for Extracting Header Words from Official Printed Arabic Documents
طريقة جديدة ومتكيفة لأستخراج كلمات الرأس من الوثائق العربية الرسمية المطبوعة

Authors: Matheel E. Abdulmunim --- Haithem K. Abass هيثم كريم عباس
Journal: AL-yarmouk Journall مجلة كلية اليرموك الجامعة ISSN: 20752954 Year: 2017 Volume: 9 Issue: 9 Pages: 114-121
Publisher: College Yarmouk University كلية اليرموك الجامعة

Loading...
Loading...
Abstract

Words extraction techniques from documents have very significant and effective role in document image analysis and retrieval systems. In this paper, a new method has been proposed for detecting and extracting header words from official printed Arabic documents. In the proposed method line of Arabic words with various fonts, styles, and sizes have been extracted from printed Arabic documents with different shapes, colors and resolutions. The extraction of header words based on effective segmentation technique that will separate different objects in a document including text lines, graphics, signature, logo, and other objects. The segmentation operation depends on document analysis that will efficiently predict vertical and horizontal distances between objects in Arabic documents. After segmentation operation, header words detection will performed by using sequence of influential rules within decision tree that correctly detected header words in a document image. Finally, list of header words will extracted as separated text lines from document image. Extracted header words can be utilized in many applications like words matching, words spotting, documents classification, documents retrieval and other applications that depends on words extraction. In this paper, a dataset of different official printed Arabic documents has been constructed and tested by the proposed method. These Arabic documents dataset obtained and gathered from various official institutions websites and offices. The proposed Arabic header words extraction method obtained 96% for recall, 98% for precision and 97% for f-score.

أصبحت لتقنيات استخراج الكلمات من الوثائق دور مهم ومؤثر في انظمة تحليل واسترجاع الوثائق المصورة. تم في هذا البحث اقتراح طريقة جديدة لتحديد واستخراج كلمات الرأس من الوثائق العربية الرسمية المطبوعة. تم في هذه الطريقة استخراج عبارات من الكلمات العربية متنوعة الخطوط والانماط والاحجام من الوثائق العربية المطبوعة المختلفة الاشكال والالوان والدقة. عملية استخراج كلمات الراس تعتمد على تقنية تجزئة فعالة تعمل على فصل مكونات الوثائق المتضمنة النصوص والشعارات والرسومات والتواقيع وغيرها. عملية التجزئة تعتمد على تحليل الوثيقة والتي يمكن من خلالها استنتاج ابعاد المسافات الافقية والعمودية بين المكونات. بعد عملية التجزئة يتم تحديد كلمات الرأس من خلال سلسلة من القواعد المؤثرة مع شجرة اتخاذ القرار التي سوف تحدد يشكل صحيح كلمات الرأس في الوثيقة المصورة. الكلمات المستخلصة يمكن الانتفاع منها في الكثير من التطبيقات مثل مطابقة الكلمات، اكتشاف الكلمات، تصنيف واسترجع الوثائق وغيرها من التطبيقات التي تعتمد على استخراج الكلمات. تم في هذا البحث بناء مجموعة بيانات من وثائق عربية رسمية مطبوعة واختبارها في الطريقة المقترحة. هذه الوثائق العربية تم الحصول عليها وتجميعها من مختلف المواقع الالكترونية الرسمية ومن المكاتب. الطريقة المقترحة لاستخراج كلمات الرأس من الوثائق العرية حصلت على 96% لنسبة الاســتدعاء و98% لنسبة الدقة و97% لمعامل الهدف.

Listing 1 - 2 of 2
Sort by
Narrow your search

Resource type

article (2)


Language

Arabic and English (1)

English (1)


Year
From To Submit

2017 (2)