research centers


Search results: Found 4

Listing 1 - 4 of 4
Sort by

Article
An Improved Distributed Association Rule Algorithm
خوارزمية علاقة ترابطية موزعة محسنة

Authors: Saad K. Majeed --- Hussein K. Abbas
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2010 Volume: 28 Issue: 18 Pages: 5695-5710
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

All Distributed association rules mining (DARM) algorithms which bases on Apriori algorithm don't have an efficient message optimization technique, so they exchange numerous messages during the mining process which needs several distributed scan operations to the distributed warehouses or distributed databases to get the support values, also the performance of these DARM algorithms decreased with increasing communication cost especially when increasing the number ofdistributed mining sites as well as the itemsets to be mined become more larger . The aim of this work is to improve association rules in distributed data mining by proposing a new efficient method of distributed association rule mining, which reduce the average size of records transferred, datasets and messages transferred without needto any distributed scan to the distributed data warehouses or distributed databases to retrieve the values of the support values of these datasets. The results obtained from the proposed method prove that the proposed method is better than the existing algorithms by reducing communications costs, centralstorage requirements, enhanceperformance and achieves high degree of scalability compared with the existing algorithms.

كل خوارزميات تعدين االعلاقات الترابطية الموزعة والمعنمدة على مبدأ خوارزمية الابرايوري لاتمتلك تقنيات كفوءة لتحقيق امثلية تناقل الرسائل، لذلك فانها تتطلب تبادل العديد من الرسائل اثناء عملية التعدين والتي تحتاج الى القيام بالعديد من عميات المسح الموزع لمخازن البيانات الموزعة او قواعد البيانات الموزعة لاسترجاع قيم الدعم ، كذلك فان اداء هذه الخوارزميات يتناقص مع زيادة كلف الاتصال وخصوصا عند زيادة عدد مواقع التعدين الموزعة بالاضافة الى ذلك عندما يصبح حجم العناصر المراد تعدينها اكبر. الهدف من البحث هو تحسين العلاقات الترابطية في تعدين البيانات الموزعة عن طريق استحداث طريقة كفوءة لتعدين العلاقات الترابطية الموزعة، تتولى تقليل حجم معدل القيود المنقولة، مجاميع البيانات والرسائل المتبادلة دون الحاجة الى اجراء مسح موزع لمخازن البيانات الموزعة او قواعدالبيانات الموزعة لاسترجاع قيم الدعم الخاص بمجموعة البيانات. النتائج المستحصلة من الطريقة المقترحة تبين افضلية عملها مقارنة بما هو موجود من الخوارزميات الموزعة وذلك بتحقيقها تقليل لكلفة الاتصال، متطلبات الخزن المركزي، وقت الحسابات، تحسين الاداء وتطبيق درجة عالية من التوسعية مقارنة بما هو موجود من الطرق


Article
MSOM: Modified Self Organizing Map for Faster Winning Cluster Detection
تعديل خريطة التنظيم الذاتي لتحديد اسرع للمجموعة الفائزة

Authors: اثير رحيم محسن --- Atheer R. Muhssen --- Abeer T. AL-obaidy عبير طارق العبيدي
Journal: Iraqi Journal of Information Technology المجلة العراقية لتكنولوجيا المعلومات ISSN: 19948638/26640600 Year: 2017 Volume: 7 Issue: 4 اللغة الانكليزية Pages: 144-163
Publisher: iraqi association of information الجمعية العراقية لتكنولوجيا المعلومات

Loading...
Loading...
Abstract

There are large number of modern techniques in today’s world which is evolving for collecting big data at different databases. Organized information investigation techniques are important to pick up/concentrate valuable data from quickly developing datasets. K-means Clustering investigation strategy is one of the generally utilized expository strategies as a part of numerous information mining applications. This paper including two stages in dealing with large and big datasets, the first stage discusses two clustering algorithms Self Organizing Map (SOM) and k-means about Performance Evaluation of K-Means and SOM Clustering. Using (C# and Matlab) programming language and the performance for k-means and SOM clustering algorithm is calculate based on the accuracy and running time.The second stage proposed modified self-organizing map(MSOM)to select winner cluster and extract this cluster from rapidly growing datasets which contain a hundred or more clusters in a very little time. This modification will appeared in two places in SOM standard algorithm. Evaluation results and conclusion will discuss in the last section. The purpose of the proposed Modified Self Organizing Map (MSOM) is to facilitate the search and access to the class that contains the desired product in the case of high number of classes where the proposed method to finding the best Class containing the desired product.

هناك عدد كبير من التقنيات الحديثة في عالم اليوم المتطور لجمع البيانات الكبيرة في قواعد البيانات المختلفة. أساليب تحليل البيانات المنظمة ضرورية للحصول على استخراج المعلومات المفيدة من قواعد البيانات التي تنمو بسرعة. طريقة K-meanلتحليل المجموعات هي إحدى الطرق المستخدمة على نطاق واسع في العديد من التطبيقات التحليلية لتنقيب البيانات. يتضمن هذا البحث مرحلتين في التعامل مع قواعد البيانات الكبيرة ومجاميع البيانات الكبيرة، المرحلة الأولى تناقش خوارزميتين اثنتين هما خريطة التنظيم الذاتي ( (SOMو K-mean حول تقييم أداء مجموعات الK-mean و SOM باستخدام اللغات البرمجية (C# و Matlab) وحساب ادائية خوارزميات المجاميع (SOM و K-mean)على أساس الدقة ووقت التنفيذ. المرحلة الثانية تقترح تعديل خريطة التنظيم الذاتي (MSOM) لتحديد الكتلة الفائزة واستخراج هذه المجموعة من مجموعات البيانات التي تنمو بسرعة والتي تحتوي على مئات أو أكثر من المجاميع في اقل وقت ممكن. وظهر هذا التعديل في مكانين في خوارزمية SOM القياسية. نتائج التقييم والاستنتاجات سيتم مناقشتها في الجزء الاخير.والغرض من هذا التعديل الذاتي تنظيم خريطة المقترحة (MSOM) هو لتسهيل البحث والوصول إلى الفئة التي تحتوي على المنتج المطلوب في حالة ارتفاع عدد الصفوف حيث الطريقة المقترحة لإيجاد أفضل الدرجة التي تحتوي على المنتج المطلوب.


Article
Proposed Method to Enhance Text Document Clustering Using Improved Fuzzy C Mean Algorithm with Named Entity Tag
طریقة مقترحة لتحسین عنقدة الوثائق النصیة باستخدام خوارزمیة العنقدة المضببة المحسنة مع علامات اسماء الكیانات

Authors: Raghad M. Hadi رغد محمد ھادي --- Soukaena H. Hashem سكینة حسن ھاشم --- Abeer T. Maolood عبیر طارق محمود
Journal: AL-MANSOUR JOURNAL مجلة المنصور ISSN: 18196489 Year: 2017 Issue: 28 Pages: 43-62
Publisher: Private Mansour college كلية المنصور الاهلية

Loading...
Loading...
Abstract

Text document clustering denotes to the clustering of correlated textdocuments into groups for unsupervised document society, text datamining, and involuntary theme extraction. The most common documentrepresentation model is vector space model (VSM) which embodies a setof documents as vectors of vital terms, outmoded document clusteringmethods collection related documents lacking at all user contact. Theproposed method in this paper is an attempt to discover how clusteringmight be better-quality with user direction by selecting features to separatedocuments. These features are the tag appear in documents, like NamedEntity tag which denote to important information for cluster names in text,through introducing a design system for documents representation modelwhich takes into account create combined features of named entity tagand use improvement Fuzzy clustering algorithms.The proposed method is tested in two levels, first level uses only vectorspace model with traditional Fuzzy c mean, and the second level usesvector space model with combined features of named entity tag and useimprovement fuzzy c mean algorithm, through uses a subset of Reuters21578 datasets that contains 1150 documents of ten topics (150)document for each topic. The results show that using second level asclustering techniques for text documents clustering achieves goodperformance with an average categorization accuracy of 90%.

عنقدة الوثائق النصیة یعني تجمیع الوثائق والنصوص المتشابھة الى عناقید وھذا التجمیع للوثائق غیرخاضع للرقابة ، عند استخراج البیانات المھمة من النص وأستخراج موضوع غیر الطوعي. النموذج الأكثرالذي یجسد مجموعة من الكلمات المھمة الموجودة (VSM) شیوعا لتمثیل الوثائق ھو نموذج متجھ الفضاءفي الوثائق ، والاسالیب القدیمة في تجمیع الوثائق المتعلقة كانت تفتقر الى اتصال المستخدم. النظام المقترحفي ھذا البحث حاول أكتشاف كیفیة تجمیع ھذه الوثائق كي تعطي جودة أفضل مع تدخل المستخدم عنطریق تحدید ملامح لفصل ھذه الوثائق. ھذه المیزات تظھر كالعلامات في الوثائق، مثل علامات الكیانالمسماة التي تدل على معلومات ھامة عن أسماء تستخدم للتصنیف في النص، من خلال تصمیم نظاممع میزات (VSM) یستخدم لتمثیل الوثائق والذي یأخذ في نظر الاعتبار إنشاء نموذج الفضاء ناقلاتمشتركة من كیان مسمى بالعلامات ویستخدم خوارزمیة تحسین العنقدة المضببة. تم اختبار النظام فيمع VSM التقلیدي، ویستخدم المستوى الثاني FCM مع VSM مستویین، یستخدم المستوى الأول الوحیدالخوارزمیة، من خلال استخدام مجموعة FCM میزات مشتركة من ا لكیان مسمى مع استخدام تحسینفرعیة من بیانات رویترز 21578 قاعدة البیانات التي تحتوي على 1150 وثیقة متكونة من عشرة مواضیعو( 150 ) وثیقة لكل موضوع. وأظھرت النتائج أن استخدام المستوى الثاني قد حقق أداء جیدا مع متوسط دقةتصنیف 90 ٪ مقارنة مع ثقنیات تجمیع الوثائق النصیة الاخرى.


Article
Comparison of Performance Between Back Propagation and K-means on Medical Datasets

Author: Asraa Abaullah Hussen
Journal: Journal of University of Babylon مجلة جامعة بابل ISSN: 19920652 23128135 Year: 2018 Volume: 26 Issue: 3 Pages: 6-9
Publisher: Babylon University جامعة بابل

Loading...
Loading...
Abstract

In recent decades, and to this day computer technology has been used in applications and various fields including the medical field, which prompted many researchers to employ this technique in the design of decision support systems using many of the algorithms and methods for this purpose. In this paper, k-means and back propagation are proposed to classify medical datasets and then compare the performance of these methods, practical experiments show back propagation has best results than k-means.

في العقود الأخيرة, وحتى يومنا هذا تكنولوجيا الحاسوب استخدمت في تطبيقات ومجالات مختلفة ومن ضمنها المجال الطبي, الذي دفع العديد من الباحثين إلى توظيف هذه التقنية ببناء أنظمة دعم القرار من خلال تطبيق العديد من الخوارزميات والطرق لهذا الغرض. في هذا البحث الشبكات ألعصبيه وK-means أقترحت لتصنيف القواعد الطبية ومن ثم مقارنة أداء هذه الطرق, التجارب العملية أظهرت الشبكات العصبية تمتلك أداء أفضل من k-means .

Listing 1 - 4 of 4
Sort by
Narrow your search

Resource type

article (4)


Language

English (3)

Arabic and English (1)


Year
From To Submit

2018 (1)

2017 (2)

2010 (1)