research centers


Search results: Found 5

Listing 1 - 5 of 5
Sort by

Article
Experimental building automatic Thesaurus By Using Data Mining

Authors: Hadeel Sh.Al-Obiady --- Arwa I.Al-Yasiri
Journal: AL-MANSOUR JOURNAL مجلة المنصور ISSN: 18196489 Year: 2008 Issue: 11 Pages: 28-75
Publisher: Private Mansour college كلية المنصور الاهلية

Loading...
Loading...
Abstract

In this paper, a new approach was presented, this approach building automatic thesaurus in the software engineering subject.The proposed approach depend on the data Mining ( that refers to the overall process of discovering patterns or building models from a given data set) for indexing all the terms that founded into abstracts of the university thesis , this done by:●Association rule: - this algorithm was used into data mining to find large item set and it is as a tool of discovery rule in our approach we used it to compute the frequency of the words into text and determined the keywords. ●Clustering techniques: it's used to classification of patterns(observation, data items, or feature vectors into groups).This new approach introduce automatic thesaurus that can be used as an effective tools for information retrieval.


Article
Genetic Based Method for Mining Association Rules
طريقة معتمدة على الخوارزميات الجينة لاستكشاف قواعد الارتباط

Author: Bushra Khireibut Jassim
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2013 Volume: 31 Issue: 3 Part (B) Scientific Pages: 325-331
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

In this paper genetic based method proposed for mining association rule, the benefit of this method it mining association rule in one step and it does not require the user-specified threshold of minimum support and minimum confidence deciding suitable threshold values of support and confidence is critical to the quality of association rule technology. Specific mechanisms for crossover operators have been designed to extract interesting rules from a transaction database.The method proposed in this paper is successfully applied to real-world database. The results demonstrate that the proposed algorithm is a practical method for mining association rules.

في هذا البحث تم استخدام طريقة معتمدة على الخوارزميات الجينية لاستكشاف قواعد الارتباط في خطوة واحدة .الطريقة المقترحة لا تتطلب من المستخدم التحديد المسبق لمعامل الدعم ولا معامل الثقة حيث يتم اكتشاف قيمها بواسطة الخوارزمية من البيانات .علما بان تحديد القيم الاولية من قبل المستخدم لهذان المعاملان امر في غاية الصعوبة.تم التعديل على العمليات الجينية التعابر والطفرة للتتناسب مع مشكلة البحث .الطريقة المقترحة طبقت بنجاح على مشاكل حقيقية واظهرت ان الطريقة المقترحة هي طريقة عملية لاكتشاف قواعد الارتباط.


Article
An Improved Distributed Association Rule Algorithm
خوارزمية علاقة ترابطية موزعة محسنة

Authors: Saad K. Majeed --- Hussein K. Abbas
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2010 Volume: 28 Issue: 18 Pages: 5695-5710
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

All Distributed association rules mining (DARM) algorithms which bases on Apriori algorithm don't have an efficient message optimization technique, so they exchange numerous messages during the mining process which needs several distributed scan operations to the distributed warehouses or distributed databases to get the support values, also the performance of these DARM algorithms decreased with increasing communication cost especially when increasing the number ofdistributed mining sites as well as the itemsets to be mined become more larger . The aim of this work is to improve association rules in distributed data mining by proposing a new efficient method of distributed association rule mining, which reduce the average size of records transferred, datasets and messages transferred without needto any distributed scan to the distributed data warehouses or distributed databases to retrieve the values of the support values of these datasets. The results obtained from the proposed method prove that the proposed method is better than the existing algorithms by reducing communications costs, centralstorage requirements, enhanceperformance and achieves high degree of scalability compared with the existing algorithms.

كل خوارزميات تعدين االعلاقات الترابطية الموزعة والمعنمدة على مبدأ خوارزمية الابرايوري لاتمتلك تقنيات كفوءة لتحقيق امثلية تناقل الرسائل، لذلك فانها تتطلب تبادل العديد من الرسائل اثناء عملية التعدين والتي تحتاج الى القيام بالعديد من عميات المسح الموزع لمخازن البيانات الموزعة او قواعد البيانات الموزعة لاسترجاع قيم الدعم ، كذلك فان اداء هذه الخوارزميات يتناقص مع زيادة كلف الاتصال وخصوصا عند زيادة عدد مواقع التعدين الموزعة بالاضافة الى ذلك عندما يصبح حجم العناصر المراد تعدينها اكبر. الهدف من البحث هو تحسين العلاقات الترابطية في تعدين البيانات الموزعة عن طريق استحداث طريقة كفوءة لتعدين العلاقات الترابطية الموزعة، تتولى تقليل حجم معدل القيود المنقولة، مجاميع البيانات والرسائل المتبادلة دون الحاجة الى اجراء مسح موزع لمخازن البيانات الموزعة او قواعدالبيانات الموزعة لاسترجاع قيم الدعم الخاص بمجموعة البيانات. النتائج المستحصلة من الطريقة المقترحة تبين افضلية عملها مقارنة بما هو موجود من الخوارزميات الموزعة وذلك بتحقيقها تقليل لكلفة الاتصال، متطلبات الخزن المركزي، وقت الحسابات، تحسين الاداء وتطبيق درجة عالية من التوسعية مقارنة بما هو موجود من الطرق


Article
Multi-Document Summarization using Fuzzy Logic and Firefly Algorithm
تلخيص النصوص المتعددة باستخدام المنطق الضبابي وخوارزميه ذبابة النار

Authors: SuhadMalallah سهاد مال الله --- Zuhair Hussein Ali .زهير حسين علي
Journal: Journal of College of Education مجلة كلية التربية ISSN: 18120380 Year: 2017 Volume: 1 Issue: 3 Pages: 139-152
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Loading...
Loading...
Abstract

Due to the huge amount of documents in the internet made it difficult to get useful information. Automatic text summarization is a good solution for such problem, which is based on a selection of important sentences from one or multi-document without losing the main ideas of the original text. In this paper a new method was proposed which depend upon selection of seven features for every sentence in the documents. These features fed into the fuzzy logic system to give scores to these sentences. Firefly algorithm applied as association rule mining to minimize the set of rules generated by the fuzzy logic system and finally redundancy reduce performed to remove redundant sentences. The proposed model is performed using dataset supplied by the Text Analysis Conference (TAC-2011) for English documents. The results were measured by using Recall-Oriented Understudy for Gisting Evaluation(ROUGE). The obtained results support the effectiveness of the proposed model.

بسبب كثرة المعلومات الموجودة في الانترنيت ولاهميتها أصبح موضوع تلخيص النصوص من المواضيع المهمة حيث يعتمد على أختيار الجمل المهمه من النصوص متعدده مع المحافظة على الفكرهالاساسيه للنصوص الملخصة. في هذا البحث تم أستخلاص النصوص بلاعتماد على أستخراج سبعة خصائص لكل جمله من جمل النصوص الملخصة. يتم تقديم هذة الخصائص الى المنطق الضبابي لاعطاءها تصنيفات بعدها تم أستخدام خوارزميه ذبابه النار لاستخراج القوانين المهمة الخاصه تصنيف ROUGEلاختبار النظام وأحتسبت النتائج باستخدام برنامج (TAC-2011)الجمل . تم أختيار قاعده بيانات


Article
A proposed Algorithm For Prediction HIV By Using Data Mining Technology

Author: Ihab L. Hussein Alsammak
Journal: Journal of University of Babylon مجلة جامعة بابل ISSN: 19920652 23128135 Year: 2019 Volume: 27 Issue: 4 Pages: 248-257
Publisher: Babylon University جامعة بابل

Loading...
Loading...
Abstract

Data mining (DM) depends on analyzing wide amounts of information from many sources with a large database to obtain significant information that can be used in different areas, such as education and healthcare, in order to obtain the best possible knowledge. Within the field of healthcare, the huge quantity of medical science information has the potential to predict dangerous illnesses such as human immunodeficiency viruses (HIV) within a short period of time if processed in a suitable way. Therefore, early handling can be set by using appropriate algorithms and methods, such as Association Rule Mining Algorithms, which will affect the diagnosis positively. The principles of the tree algorithm were based on the construction of our proposed algorithm, This paper proposes an algorithm that depends on a repeated pattern that can help doctors to distinguish the severity level of AIDS in patients by means of a database, in experimental analysis on a data set between the database of patients and the proposed algorithm. The proposed algorithm consistently takes less time to find the people with HIV as compared to the original database ,and a difference in the database memory storage has been found between the database of patients and the proposed algorithm.Traditional algorithms used in previous, such as PART, J48, and Naïve Bayes, have performed poorly to predict disease, and this problem has been solved by new technologies and the development of a predictive system for HIV status. Thus, the main goal of this research as the final results showed that the proposed algorithm is workable in an early prediction of HIV with less time and less memory storage compare it with the original database and reducing the database to a mini tree that can help predict the condition of the patient at an early stage.

يعتمد تنقيب البيانات (DM) على تحليل كميات كبيرة من المعلومات في قواعد البيانات الكبيرة بالاعتماد على العديد من المصادر للحصول على معلومات مفيدة يمكن استخدامها في مجالات مختلفة، كالتعليم والرعاية الصحية ، للحصول على أفضل معرفة ممكنة. في مجال الرعاية الصحية، فإن الكم الهائل من معلومات العلوم الطبية لديها القدرة على التنبؤ بالأمراض الخطيرة مثل مرض العوز المناعي البشري (HIV) في فترة زمنية قصيرة إذا تم معالجتها بطريقة مناسبة. لذلك، يمكن ضبط المعالجة المبكرة باستخدام الخوارزميات والأساليب المناسبة، مثل خوارزميات تعدين قواعد البيانات، والتي سوف تؤثر بشكل إيجابي على التشخيص.تم الاعتماد على مبادئ خوارزمية الشجرة لبناء الخوارزمية المقترحة ، الخوارزمية المقترحة في هذه الورقة تعتمد على الأنماط المتكررة والتي يمكن أن تساعد الأطباء في تمييز مستوى شدة مرض الإيدز لدى المصابين بالاعتماد على قاعدة البيانات، في التحليل التجريبي للخوارزمية المقترحة على مجموعة معلومات قاعدة بيانات المرضى ،تستغرق الخوارزمية المقترحة وقتًا أقل للعثور على المصابين بفيروس نقص المناعة البشرية مقارنةً بقاعدة البيانات الأصلية ونجد اختلافًا في ذاكرة تخزين قاعدة البيانات بين قاعدة بيانات المرضى والخوارزمية المقترحة.لقد ادت الخوارزميات التقليدية المستخدمة في البحوث السابقة مثل PART, J48, and Naïve Bayes اداء ضعيفا للتنبؤ بالأمراض وتم حل هذه المشكلة عن طريق التقنيات الجديدة وتطوير نظام تنبؤي لحاله فيروس نقص المناعة البشرية. وبالتالي ،فإن الهدف الرئيسي من هذا البحث كما أظهرته النتائج النهائية أن الخوارزمية المقترحة قابلة للتطبيق في التنبؤ المبكر لفيروس نقص المناعة البشرية مع وقت أقل وذاكرة خزنيه اقل مقارنه مع قاعدة البيانات الاصلية و تقليل قاعدة البيانات إلى شجرة صغيرة يمكن أن تساعد في التنبؤ بحالة المريض في مرحلة مبكرة في اقل وقت ممكن.

Listing 1 - 5 of 5
Sort by
Narrow your search

Resource type

article (5)


Language

English (5)


Year
From To Submit

2019 (1)

2017 (1)

2013 (1)

2010 (1)

2008 (1)