TY - JOUR ID - TI - A Genetic Based Optimization Model for Extractive Multi-Document Text Summarization نموذج أمثلية مستند على الخوارزمية الجينية للتلخيص الاقتطاعي للمستندات النصية المتعددة AU - Hilal H. Saleh هلال هادي صالح AU - Nasreen J. Kadhim نسرين جواد كاظم AU - Bara'a A. Attea براء علي عطية PY - 2015 VL - 56 IS - 2B SP - 1489 EP - 1498 JO - Iraqi Journal of Science المجلة العراقية للعلوم SN - 00672904 23121637 AB - Extractive multi-document text summarization – a summarization with the aim of removing redundant information in a document collection while preserving its salient sentences – has recently enjoyed a large interest in proposing automatic models. This paper proposes an extractive multi-document text summarization model based on genetic algorithm (GA). First, the problem is modeled as a discrete optimization problem and a specific fitness function is designed to effectively cope with the proposed model. Then, a binary-encoded representation together with a heuristic mutation and a local repair operators are proposed to characterize the adopted GA. Experiments are applied to ten topics from Document Understanding Conference DUC2002 datasets (d061j through d070f). Results clarify the effectiveness of the proposed model when compared with another state-of-the-art model.

التلخيص الاقتطاعي للمستندات النصية المتعددة – تلخيص يهدف الى ازالة البيانات المتكررة بمجموعة مستندات مع الحفاظ على الجمل المهمة التي تبرز المحور الرئيسي الذي تدور حوله هذه المستندات – حصل مؤخرا على اهتمام واسع من خلال اقتراح نماذج رياضية اوتوماتيكية لصياغة هذه المشكلة. هذا البحث يقوم باقتراح نموذج تلخيص اقتطاعي للمستندات النصية المتعددة مستند على الخوارزمية الجينية. حيث تم اولا نمذجة المشكلة كمشكلة افضلية متقطعة مع تصميم دالة ملائمة محددة للنموذج المقترح. والثاني هو استخدام تمثيل ثنائي مع موجه طفرة ومصحح محلي لمساعدة الخوارزمية الجينية المتبناة. التجارب طبقت على عشرة محاور من مجموعة البيانات العالمية DUC2002 وقد اظهرت النتائج فعالية النموذج المقترح عندما تمت مقارنته مع أحدى النماذج الحديثة. ER -