research centers


Search results: Found 90

Listing 1 - 10 of 90 << page
of 9
>>
Sort by

Article
Modify Initialization k-means Clustering Algorithm to Generate Initial Centroids

Author: Lamia AbedNoor Muhammed لمياء عبدنور محمد
Journal: Journal of Al-Qadisiyah for Computer Science and Mathematics مجلة القادسية لعلوم الحاسوب والرياضيات ISSN: 20740204 / 25213504 Year: 2014 Volume: 6 Issue: 2 Pages: 176-185
Publisher: Al-Qadisiyah University جامعة القادسية

Loading...
Loading...
Abstract

K-means is one of the most common clustering techniques used with numeric data. Different issues are conducted in k-means algorithm in order to reach the optimum solutions with best situations, weather producing good results or the ways used to produce the results efficiently. Initial centroids of this algorithm play important role, so the generation initial centroids attracting more work. However, this paper aims to discuss a new proposed step to improve the generation of initial centroids i.e. modification the first iteration of k-means algorithm. The experiment work of this paper would be applied with one of the famous data that is "iris", this data is suited with k-means algorithm. The experiments were tested with the origin k-means algorithm in two parameters: "execution time" and "cost function" that is represented by sum square error SSE. The results are promise work with this modification


Article
Dimensionality reduction in data from LASER applications
تقليص ابعاد البيانات المأخوذة عن التطبيقات الليزرية

Authors: Imad H.Aboud قاسم محمد جميل --- Qassim M. Jameel عماد هجول عبود
Journal: Journal of university of Anbar for Pure science مجلة جامعة الانبار للعلوم الصرفة ISSN: ISSN: 19918941 Year: 2009 Volume: 3 Issue: 1 Pages: 71-74
Publisher: University of Anbar جامعة الانبار

Loading...
Loading...
Abstract

Redundant variables not only in LASER applications, but in all experimental works are disturbing statistical analysis as a result of highly correlation among them. It is not easy sometimes to identify which set of variables is redundant and which one is retained. In addition, consideration of huge sets of variables will make it difficult to point out the joint effects of any subset of variables on a certain phenomenon. It is well know that continuous variables can be transformed into a discrete (categorical) form depending on predefined intervals, thus, the categorical principal component analysis was adopted here in this paper to identify the discarded set of variables when the data contained some variability. The effect of identifying groups of retained variables was compared by observing the natural grouping of elements using single linkage clustering of elements

تعتبر المتغيرات الفائضة ليس فقط في التطبيقات الليزرية و انما في كل الاعمال التجريبية من المزعجات التي تعترضسبل التحليل الاحصائي كنتيجة للارتباطات العالية التي يمكن تاشيرها بين هذه المتغيرات. في بعض الاحيان لا يكون سهلااعتبار أي مجموعة جزئية من المتغيرات فائضة و أي مجموعة يمكن اعتبارها لاغراض البحث. اضافة الى ذلك فان الابقاء علىمجموعات كبيرة من البيانات سوف يجعل من الصعب ايجاد تفسيرات دقيقة لمساهمة كل متغير عندما يشترك تاثيره مع متغير اواكثر من مجموعة المتغيرات المعتمدة. و لان البيانات المستمرة يمكن تحويلها الى بيانات متقطعية (حقلية)، لذا فقد تم تبني طريقةالمكونات الاساسية الحقلية في هذا البحث لتمثيل مجموعة المتغيرات الفائضة عندما تنطوي البيانات على قدر من التغاير. لقد تماختبار تاثير المتغيرات المستبعدة على طريقة تجميع المشاهدات باستخدام احد اساليب التحليل العنقودي


Article
Hierarchical Clustering for Categorical and Normal Attributes

Author: Raed Ibraheem Hamad
Journal: Journal of Baghdad College of Economic sciences University مجلة كلية بغداد للعلوم الاقتصادية الجامعة ISSN: 2072778X Year: 2007 Issue: 15 Pages: 327-338
Publisher: Baghdad College of Economic Sciences كلية بغداد للعلوم الاقتصادية

Loading...
Loading...
Abstract

The amount of data kept in computer files and databases is growing at a phenomenal rate. At the same time the users of these data are expecting more sophisticated information from them. the problem of data mining or knowledge discovery has become increasingly important in recent years.there is an enormous wealth of information embedded in large data warehouses.Alternatively the data mining has been called exploratory data analysis,data driven discovery, and deductive learning. the clustering algorithm which is one of the data mining algorithms is useful technique for grouping data points such that points within a single group/cluster have similar characteristics.


Article
Modified Grid Clustering Technique to Predict Heat Transfer Coefficient in a Duct of Arbitrary Cross Section Area
طريقة مطورة لتنضيد العقد لغرض التنبؤ بمعامل انتقال الحرارة على طول مجرى ذو مقطع مساحة اعتباطي

Author: AbdulKareem Abbas Khudhair عبد الكريم عباس خضير
Journal: Journal of Engineering مجلة الهندسة ISSN: 17264073 25203339 Year: 2015 Volume: 21 Issue: 12 Pages: 155-169
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

A simple straightforward mathematical method has been developed to cluster grid nodes on a boundary segment of an arbitrary geometry that can be fitted by a relevant polynomial. The method of solution is accomplished in two steps. At the first step, the length of the boundary segment is evaluated by using the mean value theorem, then grids are clustered as desired, using relevant linear clustering functions. At the second step, as the coordinates cell nodes have been computed and the incremental distance between each two nodes has been evaluated, the original coordinate of each node is then computed utilizing the same fitted polynomial with the mean value theorem but reversibly.The method is utilized to predict Nusselt number distribution in a hybrid cross section area duct, non-circular non-rectangular, for laminar incompressible flow under Uniform Wall Temperature condition. The results have been compared with the published data and the agreement has been found very well.

تم تطوير طريقة رياضية مباشرة لتنضيد العقد على قطعة حد منحنية ذات شكل اعتباطي بشرط انه يمكن تمثيل قطعة الحد هذه باستعمال متطابقة متعددة الحدود مناسبة. تتكون طريقة الحل بشكل عام من مرحلتين. الأولى تتمثل بتحويل قطعة الحد هذه الى قطعة مستقيم وايجاد طولها باستخدام نظرية متوسط القيمة. ثم نقوم بتوزيع العقد على قطعة المستقيم باستخدام طرق التنضيد الملائمة. وتتمثل المرحلة الثانية بإرجاع المستقيم الى أصله كقطعة خط منحني بعد ان تمت معرفة احداثيات العقد والمسافات بينها بالاستفادة من متطابقة متعددة الحدود نفسها ونظرية متوسط القيمة ولكن بشكل معكوس.استخدمت الطريقة لإيجاد توزيع عدد نسلت على طول مجرى ذو مقطع هجين غير دائري وغير مستطيل لجريان طباقي غير انضغاطي وتمت مقارنة النتائج مع البيانات المنشورة وكان التطابق جيد جدا.


Article
Clustering Approach to Minimize the Consumed Energy in WSNs
النظرية العنقودية لتقليل استهلاك الطاقة في شبكات الاستشعار اللاسلكية

Author: Mohammed Saad Talib
Journal: journal of kerbala university مجلة جامعة كربلاء ISSN: 18130410 Year: 2017 Volume: 15 Issue: 2 Pages: 70-78
Publisher: Kerbala University جامعة كربلاء

Loading...
Loading...
Abstract

Saving energy or energy consumption represents the essential problem in the process of designing, deploying and operating any "wireless sensor networks" (WSN). Most of the available produced sensors depend on a "limited power supply" battery in all their operations. Most of the sensors can perform the process of sensing, "data processing" and "wireless communication". Sensors can achieve various duties in WSNs according to their wanted applications.In most applications sensors are ordered into sets called clusters according to the network objective and its requirements. Clustering achieved many advantages, so it represents the first preferable approach in designing or improving any WSN. Each cluster includes one leader sensor node known as a "cluster head" (CH) and the other sensors known as member nodes. In most applications the sensor node with higher energy is preferred to be a CH to perform the process of data transmission and data processing while those with low energy are preferred to achieve the sensing task as cluster members. Simulation being the unique tool in evaluating and estimating the performance metrics of any new designed WSN.In this study, a main effort is made to study the effect of clustering approaches on the WSNs consumed energy. Many clustering approaches is simulated and evaluated with a developed suggested clustering approach. Three approaches were suggested, built and simulated to estimate the WSNs lifetime with their important behaviors parameters. Net Logo (5.2.1) as "multi-agent programming language" is suggested to be the simulation tool in this study.

توفير الطاقة او استهلاكها هي المشكلة الاساسية في عملية تصميم ونشر شبكات الاستشعار اللاسلكي (WSN) ,فمعظم اجهزة الاستشعار المتاحة تعتمد على بطارية ذات قدرة محددة لتزويدها بالطاقة في كافة عملياتها. يمكن لجميع اجهزة الاستشعار اداء عملية معالجة البيانات, والاستشعارعن بعد و تناقل البيانات . كما ان اجهزة الاستشعار تؤدي واجبات مختلفة في شبكات الاستشعار اللاسلكي وفقاً للحاجة ونوع الشبكة. في معظم تطبيقات اجهزة الاستشعاراللاسلكية يتم ترتيبها على شكل مجموعات او عناقيد وفقاً لهدف الشبكة ومتطلباتها. حققت عملية العنقدة العديد من المزايا ولذلك اصبحت تمثل النهج والخيار الاول عند تصميم او تحسين شبكات الاستشعار اللاسلكي. كل مجموعة (عنقود) تحتوي على عقدة استشعار تسمى العقدة الرئيسية (رئيس المجموعة) والعقد الاخرى في المجموعة تسمى العقد الاعضاء. في معظم التطبيقات يفضل استخدام عقد الاستشعار ذات الطاقة العالية لتنفيذ عملية نقل ومعالجة البيانات في حين يفضل استخدام عقد الاستشعار ذات الطاقة المنخفضة لتحقيق مهمة الاستشعار وتعمل كاحد اعضاء المجموعة. المحاكاة هي الاداة الفريدة التي يمكن استخدامها في تقييم وتقدير مقاييس اداء وسلوك اي تصميم جديد لشبكات الاستشعار اللاسلكي. تناولت هذه الدراسة مناقشة تأثير اسلوب العنقدة على الطاقة المستهلكة في شبكات الاستشعار اللاسلكي. تمت محاكاة وتقييم العديد من اساليب العنقدة المتوفرة مع تطوير اسلوب عنقدة مقترح. تم اقتراح وبناء ومحاكاة ثلاثة اساليب لتقدير اعمار شبكات الاستشعار اللاسلكي مع جميع معلمات سلوكياتها. تم استخدام برنامج ال (Net Logo 5.2.1 ) كلغة برمجة" multi-agent " ليكون اداة المحاكاة في هذه الدراسة.


Article
A NOVEL EDGE DETECTION METHOD USING K-MEANS CLUSTERING
طريقة جديدة للكشف عن الحافات باستخدام تجميع k-means

Authors: Walaa Mohammed Khalaf --- Kadhum Al-Majdi --- Noor Hashim Hamed
Journal: Journal of Engineering and Sustainable Development مجلة الهندسة والتنمية المستدامة ISSN: 25200917 Year: 2016 Volume: 20 Issue: 6 Pages: 207-215
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Loading...
Loading...
Abstract

In this paper, a new approach is introduced to detect the edges of any kind of gray scale images by using k-means clustering algorithm, where three novel features are proposed by taking the advantages of the similarity of image pixel with its eight surrounding neighbors through feeding these features as attributes to the clustering system. This method of edge detection does not use neither any smoothing filter nor threshold values. The experimental results show that an acceptable detection of the edges is done.

في هذا البحث تم تقديم طريقة جديدة للكشف عن الحافات في اي نوع من انواع الصور ذات التدرج الرمادي بأعتماد خوارزمية تجميع (ك) من المعدلات، حيث تم افتراض ثلاثة ميزات جديدة بالاستفادة من التشابه ما بين البيكسل و متجاوراتها الثمانية المحيطة بها و من ثم تزويد تلك الميزات الخاصة بكل بيكسل كصفات الى نظام التجميع. هذه الطريقة الخاصة بأكتشاف الحافات للصور لا تستخدم اي مرشح تجانسي ولا اي قيمة للعتبة. النتائج التجريبية اظهرت بأن كشف مقبول للحواف قد تم من خلال استخدام هذه الطريقة.


Article
Proposed KDBSCAN Algorithm for Clustering
خوارزمية KDBSCAN المقترحة للتجميع

Authors: Yossra Hussein يسرى حسين --- Safa Abdel Jalil صفا عبد الجليل
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2018 Volume: 59 Issue: 1A Pages: 173-178
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Science, technology and many other fields are use clustering algorithm widely for many applications, this paper presents a new hybrid algorithm called KDBSCAN that work on improving k-mean algorithm and solve two of its problems, the first problem is number of cluster, when it`s must be entered by user, this problem solved by using DBSCAN algorithm for estimating number of cluster, and the second problem is randomly initial centroid problem that has been dealt with by choosing the centroid in steady method and removing randomly choosing for a better results, this work used DUC 2002 dataset to obtain the results of KDBSCAN algorithm, it`s work in many application fields such as electronics libraries, biology and marketing, the KDBSCAN algorithm that described in this paper has better results than traditional K-mean and DBSCAN algorithms in many aspects, its preform stable result with lower entropy.

العلوم والتكنولوجيا والعديد من المجالات الاخرى تستخدم خوارزميات التجميع بصورة كبيرة للعديد من التطبيقات, هذ البحث يقدم خوارزمية دمج جديدة تسمى KDBSCAN والتي تعمل على تطوير خوارزمية K-mean لحل اثنان من مشاكلها, المشكلة الاولى هو عدد المجاميع, والذي يجب ان يتم ادخاله عن طريق المستخدم, وتم حل هذه المشكلة عن طريق استخدام خوارزمية DBSCAN لتخمين عدد المجاميع, و المشكلة الثانية هو الاختيار العشوائي للمراكز, و الذي تم تعامل معهاعن طريق المراكز بطريقة ثابتة وازالة عشوائية الاختيار للحصول على نتائج افضل, تم العمل بأستخدام قاعدة بيانات DUC 2002 للحصول على النتائج خوارزمية KBSCAN, هي تعمل في تطبيقات متعددة مثلا المكتبات الالكترونية, علم البايولوجي و مراكز التسوق, خوارزمية KDBSCAN التي تم وصفها في هذا البحث لها نتائج احسن من الخوارزميتين K-mean التقليدية و DBSCAN في جوانب متعددة, حيث انها توفر نتائج ثابتة وعشوائية قليلة.

Keywords

clustering --- K-mean --- DBSCAN --- KDBSCAN.


Article
A Proposed Framework for Analyzing Crime Data Set Using Decision Tree and Simple K-Means Mining Algorithms

Author: Kadhim B. Swadi Al-Janabi د.كاظم بريهي سوادي الجنابي
Journal: Journal of Kufa for Mathematics and Computer مجلة الكوفة للرياضيات والحاسوب ISSN: 11712076 Year: 2011 Volume: 1 Issue: 3 Pages: 8-24
Publisher: University of Kufa جامعة الكوفة

Loading...
Loading...
Abstract

AbstractThis paper presents a proposed framework for the crime and criminal data analysis and detection using Decision tree Algorithms for data classification and Simple K Means algorithm for data clustering. The paper tends to help specialists in discovering patterns and trends, making forecasts, finding relationships and possible explanations, mapping criminal networks and identifying possible suspects. The classification is based mainly on grouping the crimes according to the type, location, time and other attributes; Clustering is based on finding relationships between different Crime and Criminal attributes having some previously unknown common characteristics. The results of both classifications and Clustering are used for prediction of trends and behavior of the given objects (Crimes and Criminals).Data for both crimes and criminals were collected from free police departments’ dataset available on the Internet to create and test the proposed framework, and then these data were preprocessed to get clean and accurate data using different preprocessing techniques (cleaning, missing values and removing inconsistency). The preprocessed data were used to find out different crime and criminal trends and behaviors, and crimes and criminals were grouped into clusters according to their important attributes. WEKA mining software and Microsoft Excel were used to analyze the given data.

الملخص:تقدم هذه الورقةِ البحثية إطارا ونموذجا لتحليلِ بياناتِ الجريمةَ باستخدام تقنيات وخوارزميات مفاهيم التنقيب عن البيانات (التصنيف والتجميع Classification and Clustering)بهدف تقديم افضل المعلومات الى المختصين في علم الجريمة للمساعدة في الكشف عن الجريمة. يهدف البحث إلى مساعدة الإختصاصيين في إكتِشاف الأنماطِ والإتّجاهاتِ للجرائم والمجرمين و إيجاد عِلاقاتِ وتفسيراتِ محتملةِ للجرائم ومتابعة الشبكاتَ إلاجراميةَ وتمييز مشتبه بهمَ محتملينَ. إنّ التصنيفَ بشكل رئيسي يستند اساسا على تصنيف الجرائمِ طبقاً للنوعِ، العنوان، وقت حصول الجريمة، صفات المشتبه بهم وغيرها. اضافة الى إيجاد العلاقات بين الجرائم المختلفة والخواص الإجراميةِ. ولتحقيق ذلك تم استخدام خوارزميات مختلفة لما يسمى بشجرة القرارات Decision Tree Algorithms لاجراء عملية التصنيف وتقنيات المتوسط البسيط Simple K-Mean للتجميع.تم تجميع البيانات عن الجرائم والمجرمين من البيانات الحرة على الانترنت، حيث استخدمت هذه البيانات لانشاء واختبار النموذج المقترح، وقد تم استخدام خوارزميات مختلفة لاعداد هذه البيانات لكي تتلائم مع خوارزميات التنقيب المختلفة وبعد ذلك تم تطبيق خوارزميات التصنيف والتجميع للحصول على المعلومات التي تساعد في اعطاء رؤية واضحة عن الجرائم والمجرمين. وقد استخدمت برامجياتWEKA و Excel لمعالجة وتحليل تلك البيانات


Article
An Improved Algorithm for Data Preprocessing in Mining Crime Data Set

Author: Kadhim B. Swadi Aljanabi كاظم بريهي سوادي
Journal: Journal of Kufa for Mathematics and Computer مجلة الكوفة للرياضيات والحاسوب ISSN: 11712076 Year: 2011 Volume: 1 Issue: 4 Pages: 81-87
Publisher: University of Kufa جامعة الكوفة

Loading...
Loading...
Abstract

This paper presents an improved algorithm for data preprocessing to solve the problem of missing values and smoothing the outliers in the real world data sets. Previous works in this field are based mainly on replacing the missing values with the average, class average, most common values and some other techniques in the same direction, and outliers were generally cancelled from the data set. Crime and criminal data sets have their own special characteristics and benchmark in that missing values and outliers have different meanings than in other fields, so they need to be processed in different manners. The algorithm is based mainly on using clustering techniques to group the objects according to their similarities and dissimilarities, then smoothing the outliers accordingly and the missing values are processed according to their clusters. WEKA is used as a tool to find different clusters of the criminals.


Article
Parallel Genetic Algorithm for Color Image Segmentation

Author: Ahmed K. Obaed
Journal: Journal of University of Babylon مجلة جامعة بابل ISSN: 19920652 23128135 Year: 2007 Volume: 14 Issue: 1 Pages: 10-14
Publisher: Babylon University جامعة بابل

Loading...
Loading...
Abstract

This paper presents a Parallel Genetic Algorithm (PGA) based on the distributed (island) paradigm to optimize color image segmentation. The goal of using PGA is to accelerate the process of segmentation. However, that is not the only motivation for parallelism. Even when speed is not primary factor, these distributed algorithms, and as we shall see through the results, often outperform GAs with single population. Some examples in color images are presented and overall results discussed.

Listing 1 - 10 of 90 << page
of 9
>>
Sort by
Narrow your search

Resource type

article (90)


Language

English (77)

Arabic (6)

Arabic and English (5)


Year
From To Submit

2019 (10)

2018 (11)

2017 (15)

2016 (11)

2015 (8)

More...