research centers


Search results: Found 4

Listing 1 - 4 of 4
Sort by

Article
Multi-Document Summarization using Fuzzy Logic and Firefly Algorithm
تلخيص النصوص المتعددة باستخدام المنطق الضبابي وخوارزميه ذبابة النار

Authors: SuhadMalallah سهاد مال الله --- Zuhair Hussein Ali .زهير حسين علي
Journal: Journal of College of Education مجلة كلية التربية ISSN: 18120380 Year: 2017 Volume: 1 Issue: 3 Pages: 139-152
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Loading...
Loading...
Abstract

Due to the huge amount of documents in the internet made it difficult to get useful information. Automatic text summarization is a good solution for such problem, which is based on a selection of important sentences from one or multi-document without losing the main ideas of the original text. In this paper a new method was proposed which depend upon selection of seven features for every sentence in the documents. These features fed into the fuzzy logic system to give scores to these sentences. Firefly algorithm applied as association rule mining to minimize the set of rules generated by the fuzzy logic system and finally redundancy reduce performed to remove redundant sentences. The proposed model is performed using dataset supplied by the Text Analysis Conference (TAC-2011) for English documents. The results were measured by using Recall-Oriented Understudy for Gisting Evaluation(ROUGE). The obtained results support the effectiveness of the proposed model.

بسبب كثرة المعلومات الموجودة في الانترنيت ولاهميتها أصبح موضوع تلخيص النصوص من المواضيع المهمة حيث يعتمد على أختيار الجمل المهمه من النصوص متعدده مع المحافظة على الفكرهالاساسيه للنصوص الملخصة. في هذا البحث تم أستخلاص النصوص بلاعتماد على أستخراج سبعة خصائص لكل جمله من جمل النصوص الملخصة. يتم تقديم هذة الخصائص الى المنطق الضبابي لاعطاءها تصنيفات بعدها تم أستخدام خوارزميه ذبابه النار لاستخراج القوانين المهمة الخاصه تصنيف ROUGEلاختبار النظام وأحتسبت النتائج باستخدام برنامج (TAC-2011)الجمل . تم أختيار قاعده بيانات


Article
TOPSIS with Multiple Linear Regression for Multi-Document Text Summarization
مع الانحدار الخطي المتعدد لتلخيص النصوص المتعددهTopsis

Authors: Suhad Malallah سهاد مال الله --- Zuhair Hussein Ali زهير حسين علي
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2017 Volume: 58 Issue: 3A Pages: 1298-1307
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

The huge amount of information in the internet makes rapid need of text summarization. Text summarization is the process of selecting important sentences from documents with keeping the main idea of the original documents. This paper proposes a method depends on Technique for Order of Preference by Similarity to Ideal Solution (TOPSIS). The first step in our model is based on extracting seven features for each sentence in the documents set. Multiple Linear Regression (MLR) is then used to assign a weight for the selected features. Then TOPSIS method applied to rank the sentences. The sentences with high scores will be selected to be included in the generated summary. The proposed model is evaluated using dataset supplied by the Text Analysis Conference (TAC-2011) for English documents. The performance of the proposed model is evaluated using Recall-Oriented Understudy for Gisting Evaluation (ROUGE) metric. The obtained results support the effectiveness of the proposed model.

بالنظر للكميات الكبيرة الموجودة من المعلومات في الانترنت ادى الى الحاجة الضرورية لتلخيص المعلومات. أن عملية تلخيص المعلومات تتضمن أستخراج الجمل المهمه من النصوص مع المحافظة على الافكار الرئيسية للنصوص الملخصه. هذا البحث يقترح طريقة تعتمد على تقنية ترتيب الافضلية عن طريق التشابه الى الحل المثالي((TOPSIS. الخطوة الاولى في موديلنا المقترح تعتمد على أستخراج سبعة خصائص لكل جملة من جمل النصوص المراد تلخيصها. بعدها تم طريقة أستخدام الانحدار الخطي المتعدد لغرض تعيين أوزان للخصائص المختارة. ثم تطبق طريقة TOPSIS لغرض ترتيب الجمل. يتم أختيار الجمل ذات الدرجة الاعلى لغرض تضمينها ضمن الملخص المتكون.تم أستخدام قاعدة بيانات ( TAC-2011 ) للغة الانكليزية. أختبرت النتائج باستخدام برنامج ROUGE أثبتت النتائج كفاءه النظام المقترح.


Article
Multilingual Text Summarization based on LDA and Modified PageRank
تلخيص النصوص للغات متعددة بالاعتماد على تحليل التمييز الخطي ورتية الصفحة المعدلة

Authors: Suhad Malallah سهاد مال الله --- Zuhair Hussein Ali زهير حسين علي
Journal: Iraqi Journal of Information Technology المجلة العراقية لتكنولوجيا المعلومات ISSN: 19948638/26640600 Year: 2019 Volume: 9 Issue: 3 اللغة الانكليزية Pages: 139-160
Publisher: iraqi association of information الجمعية العراقية لتكنولوجيا المعلومات

Loading...
Loading...
Abstract

Text summarization is the process of generating a single document from document(s) with keeping the main idea of the summarized document(s). In this paper a proposed method which based on Linear Discriminant Analysis (LDA) and modified PageRank applied to summarize Arabic and English documents. Firstly, seven features extracted from each sentence in the document set. LDA classifier applied to classify sentences as important or unimportant sentences. Only important sentences pass to the next step which based on constructing a graph and applied modified PageRank algorithm to assign scores to each sentence in the graph. The proposed model is evaluated using dataset supplied by the Text Analysis Conference (TAC-2011). The performance of the proposed model is evaluated using Recall-Oriented Understudy for Gisting Evaluation (ROUGE) metric. The obtained results support the effectiveness of the proposed model.

تلخيص النصوص هو عملية إنشاء وثيقة واحدة من الوثائق الملخصة مع الاحتفاظ بالفكرة الرئيسية للوثيقة (الوثائق) الملخصة. في هذا البحث ، تم تطبيق طريقة مقترحة تعتمد على تحليل التمييز الخطي مع رتبة الصفحة المعدلة((PageRank لتلخيص النصوص العربية والانكليزية. اولا تم استراج سبعة خصائص لكل جملة من الجمل الموجودة في الوثائق الملخصة . تم استخدام خوارزمية تحليل التمييز الخطي لتصنيف الجمل الى جمل مهمة وغير مهمة. الجمل المهمة فقط ستمرر الى المرحلة التالية حيث تم بناء مخطط لها ثم استخدمت رتبة الصفحة لوضع درجة لكل جملة موجودة في المخطط. تم تقييم النموذج المقترح باستخدام مجموعة بيانات مقدمة من مؤتمر تحليل النصوص (TAC-2011). ﺗم ﺗﻘﯾﯾم أداء اﻟﻧﻣوذج اﻟﻣﻘﺗرح ﺑﺎﺳﺗﺧدام ﻣﻘﺎﯾﯾس (ROUGE). النتائج التي تم الحصول عليها تدعم فعالية النموذج المقترح

Keywords

LDA --- PageRank --- ROUGE --- TAC-2011


Article
Multi-Document Text Summarization Based on Multiple Linear Regression
تلخيص النصوص المتعدده بالاعتماد على الانحدار الخطي المتعدد

Authors: Suhad Malallah سهاد مال الله --- Zuhair Hussein Ali زهير حسين علي
Journal: AL-MANSOUR JOURNAL مجلة المنصور ISSN: 18196489 Year: 2018 Issue: 30 Pages: 1-16
Publisher: Private Mansour college كلية المنصور الاهلية

Loading...
Loading...
Abstract

Due to the huge amount of information on the internet makes text summarization growth rapidly. Text summarization is the process of selecting important sentences from documents with keeping the main idea of the original documents. Features considered the basis of text summarization. In this paper a method for assigning a weight to selected features was developed which is depend on building a mathematical model using Multiple Linear Regression which estimate the weights between dependent and independent variables. The proposed model is evaluated using dataset supplied by the Text Analysis Conference (TAC-2011) for English documents. The results were measured by using Recall-Oriented Understudy for Gisting Evaluation(ROUGE. The obtained results support the effectiveness of the proposed model

بالنظر للكميات الكبيره الموجوده من المعلومات في الانترنت ادى ذلك الى الحاجه الضروريه لتلخيص المعلومات. أن عمليه تلخيص المعلومات تتضمن أستخراج الجمل المهمه من النصوص مع المحافظه على الافكار الرئيسيه للنصوص الملخصه. في هذا البحث تم بناء نموذج رياضي اعتمادا على ألانحدار الخطي المتعدد وذلك بتقديرالأوزان للخواص المتعدده المستخرجه من كل جمله من جمل النصوص. تم أستخدام قاعدة البيانات ( TAC-2011 ) لتجربة النموذج الرياضي المقترح. أختبارات النتائج باستخدام برنامج ROUGE أثبتت كفاءة النظام المقترح

Listing 1 - 4 of 4
Sort by
Narrow your search

Resource type

article (4)


Language

English (3)

Arabic and English (1)


Year
From To Submit

2019 (1)

2018 (1)

2017 (2)