research centers


Search results: Found 2

Listing 1 - 2 of 2
Sort by

Article
Extractive Multi-Document Text Summarization Using Multi-Objective Evolutionary Algorithm Based Model
التلخيص الأقتطاعي للنصوص متعددة المستندات باستخدام نموذج مستند على الخوارزمية التطورية متعددة الاهداف

Authors: Hilal H. Saleh هلال هادي صالح --- Nasreen J. Kadhim نسرين جواد كاظم
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2016 Volume: 57 Issue: 1C Pages: 728-741
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Automatic document summarization technology is evolving and may offer a solution to the problem of information overload. Multi-document summarization is an optimization problem demanding optimizing more than one objective function concurrently. The proposed work considers a balance of two significant objectives: content coverage and diversity while generating a summary from a collection of text documents. Despite the large efforts introduced from several researchers for designing and evaluating performance of many text summarization techniques, their formulations lack the introduction of any model that can give an explicit representation of – coverage and diversity – the two contradictory semantics of any summary. The design of generic text summarization model based on sentence extraction is modeled as an optimization problem redirected into more semantic measure reflecting individually both content coverage and content diversity as an explicit individual optimization models. The proposed two models are then coupled and defined as a multi-objective optimization (MOO) problem. Up to the best of our knowledge, this is the first attempt to address text summarization problem as a MOO model. Moreover, heuristic perturbation and heuristic local repair operators are proposed and injected into the adopted evolutionary algorithm to harness its strength. Assessment of the proposed model is performed using document sets supplied by Document Understanding Conference 2002 (DUC 2002) and a comparison is made with other state-of-the-art methods using Recall-Oriented Understudy for Gisting Evaluation (ROUGE) toolkit. Results obtained support strong proof for the effectiveness of the proposed model based on MOO over other state-of-the-art models.

تقنية التلخيص الأوتوماتيكي تطور وربما تقدم حل الى مشكلة الحمل الزائد للمعلومات. عملية التلخيص للنصوص متعددة المستندات تصنف على انها مشكلة أمثلية تتطلب الاستفادة المثلى من اكثر من دالة هدف في وقت واحد. العمل المقترح يأخذ بنظر الأعتبار تحقيق التوازن بين هدفين مهمين هما: تغطية المحتوى لمجموعة المستندات والتنوع عند توليد ملخص من مجموعة من المستندات النصية. على الرغم من الجهود القائمة على تصميم و تقييم أداء العديد من تقنيات تلخيص النصوص, تفتقر صياغات هذه التقنيات الى تقديم أي نموذج يمكن أن يعطي التمثيل الصريح – تغطية المحتوى والتنوع – وهما دلالتان متناقضتان في أي ملخص. أن تصميم نموذج يهدف الى تلخيص نص عام قائم على أقتطاع الجمل تمت أعادة توجيهه الى تدبير ذات دلالة اكبر يعكس بصورة مستقلة كلا من تغطية وتنوع المحتوى كنموذجي أمثلية صريحين. بعد ذلك تمت عملية اقتران النموذجين المقترحين وتعريفهما كمشكلة أمثلية تعدد الاهداف. حسب علمنا ، هذه هي المحاولة الأولى لمعالجة مشكلة تلخيص النصوص كنموذج أمثلية متعدد الأهداف. وعلاوة على ذلك ، تم أقتراح عامل توجيه اضطراب وعامل توجيه أصلاح محلي وحقنهما في الخوارزمية التطورية المعتمدة لتسخير قوتها . عملية تقييم النموذج المقترح تمت باستخدام مجموعة المستندات المجهزة من قبل مجموعة البيانات العالمية (Document Understanding Conference DUC 2002) وقد تمت مقارنة النتائج المتحصلة مع مجموعة من الانظمة الحديثة. قياس وتقييم الأداء للنموذج المقترح تم باستخدام أدوات (ROUGE). النتائج المتحصلة دعمت العمل بدليل قوي على فعالية النموذج المقترح المستند على أمثلية تعدد الاهداف نسبة الى النماذج الحديثة التي تمت المقارنة بها.


Article
A Genetic Based Optimization Model for Extractive Multi-Document Text Summarization
نموذج أمثلية مستند على الخوارزمية الجينية للتلخيص الاقتطاعي للمستندات النصية المتعددة

Authors: Hilal H. Saleh هلال هادي صالح --- Nasreen J. Kadhim نسرين جواد كاظم --- Bara'a A. Attea براء علي عطية
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2015 Volume: 56 Issue: 2B Pages: 1489-1498
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Extractive multi-document text summarization – a summarization with the aim of removing redundant information in a document collection while preserving its salient sentences – has recently enjoyed a large interest in proposing automatic models. This paper proposes an extractive multi-document text summarization model based on genetic algorithm (GA). First, the problem is modeled as a discrete optimization problem and a specific fitness function is designed to effectively cope with the proposed model. Then, a binary-encoded representation together with a heuristic mutation and a local repair operators are proposed to characterize the adopted GA. Experiments are applied to ten topics from Document Understanding Conference DUC2002 datasets (d061j through d070f). Results clarify the effectiveness of the proposed model when compared with another state-of-the-art model.

التلخيص الاقتطاعي للمستندات النصية المتعددة – تلخيص يهدف الى ازالة البيانات المتكررة بمجموعة مستندات مع الحفاظ على الجمل المهمة التي تبرز المحور الرئيسي الذي تدور حوله هذه المستندات – حصل مؤخرا على اهتمام واسع من خلال اقتراح نماذج رياضية اوتوماتيكية لصياغة هذه المشكلة. هذا البحث يقوم باقتراح نموذج تلخيص اقتطاعي للمستندات النصية المتعددة مستند على الخوارزمية الجينية. حيث تم اولا نمذجة المشكلة كمشكلة افضلية متقطعة مع تصميم دالة ملائمة محددة للنموذج المقترح. والثاني هو استخدام تمثيل ثنائي مع موجه طفرة ومصحح محلي لمساعدة الخوارزمية الجينية المتبناة. التجارب طبقت على عشرة محاور من مجموعة البيانات العالمية DUC2002 وقد اظهرت النتائج فعالية النموذج المقترح عندما تمت مقارنته مع أحدى النماذج الحديثة.

Listing 1 - 2 of 2
Sort by
Narrow your search

Resource type

article (2)


Language

English (2)


Year
From To Submit

2016 (1)

2015 (1)