research centers


Search results: Found 23

Listing 1 - 10 of 23 << page
of 3
>>
Sort by

Article
A Proposed Framework for Analyzing Crime Data Set Using Decision Tree and Simple K-Means Mining Algorithms

Author: Kadhim B. Swadi Al-Janabi د.كاظم بريهي سوادي الجنابي
Journal: Journal of Kufa for Mathematics and Computer مجلة الكوفة للرياضيات والحاسوب ISSN: 11712076 Year: 2011 Volume: 1 Issue: 3 Pages: 8-24
Publisher: University of Kufa جامعة الكوفة

Loading...
Loading...
Abstract

AbstractThis paper presents a proposed framework for the crime and criminal data analysis and detection using Decision tree Algorithms for data classification and Simple K Means algorithm for data clustering. The paper tends to help specialists in discovering patterns and trends, making forecasts, finding relationships and possible explanations, mapping criminal networks and identifying possible suspects. The classification is based mainly on grouping the crimes according to the type, location, time and other attributes; Clustering is based on finding relationships between different Crime and Criminal attributes having some previously unknown common characteristics. The results of both classifications and Clustering are used for prediction of trends and behavior of the given objects (Crimes and Criminals).Data for both crimes and criminals were collected from free police departments’ dataset available on the Internet to create and test the proposed framework, and then these data were preprocessed to get clean and accurate data using different preprocessing techniques (cleaning, missing values and removing inconsistency). The preprocessed data were used to find out different crime and criminal trends and behaviors, and crimes and criminals were grouped into clusters according to their important attributes. WEKA mining software and Microsoft Excel were used to analyze the given data.

الملخص:تقدم هذه الورقةِ البحثية إطارا ونموذجا لتحليلِ بياناتِ الجريمةَ باستخدام تقنيات وخوارزميات مفاهيم التنقيب عن البيانات (التصنيف والتجميع Classification and Clustering)بهدف تقديم افضل المعلومات الى المختصين في علم الجريمة للمساعدة في الكشف عن الجريمة. يهدف البحث إلى مساعدة الإختصاصيين في إكتِشاف الأنماطِ والإتّجاهاتِ للجرائم والمجرمين و إيجاد عِلاقاتِ وتفسيراتِ محتملةِ للجرائم ومتابعة الشبكاتَ إلاجراميةَ وتمييز مشتبه بهمَ محتملينَ. إنّ التصنيفَ بشكل رئيسي يستند اساسا على تصنيف الجرائمِ طبقاً للنوعِ، العنوان، وقت حصول الجريمة، صفات المشتبه بهم وغيرها. اضافة الى إيجاد العلاقات بين الجرائم المختلفة والخواص الإجراميةِ. ولتحقيق ذلك تم استخدام خوارزميات مختلفة لما يسمى بشجرة القرارات Decision Tree Algorithms لاجراء عملية التصنيف وتقنيات المتوسط البسيط Simple K-Mean للتجميع.تم تجميع البيانات عن الجرائم والمجرمين من البيانات الحرة على الانترنت، حيث استخدمت هذه البيانات لانشاء واختبار النموذج المقترح، وقد تم استخدام خوارزميات مختلفة لاعداد هذه البيانات لكي تتلائم مع خوارزميات التنقيب المختلفة وبعد ذلك تم تطبيق خوارزميات التصنيف والتجميع للحصول على المعلومات التي تساعد في اعطاء رؤية واضحة عن الجرائم والمجرمين. وقد استخدمت برامجياتWEKA و Excel لمعالجة وتحليل تلك البيانات


Article
Studying the Impact of Handling the Missing Values on the Dataset On the Efficiency of Data Mining Techniques
دراسة اثر معالجة القيم المحذوفة في قاعدة البيانات على كفاءة تقنيات تنقيب البيانات

Author: Bushra M. Hussan & Ghaida al-Suhal& Amal Hameed Khaleel بشرى محمد حسن ، غيداء عبدالرزاق ، امل حميد خليل
Journal: basrah journal of science البصرة للعلوم ISSN: 18140343 Year: 2012 Volume: 30 Issue: 2A english Pages: 128-141
Publisher: Basrah University جامعة البصرة

Loading...
Loading...
Abstract

Medical data has potential information for extracting hidden patterns in the data sets. Classification is form of data analysis that can used to extract models describing important data classes or to predict future data trend. Such analysis can help providing us with a better understanding of the large data.The diagnosis of a medical from symptoms is one example of classification tasks, in which the classes could be either the various disease states or the possible therapies. Data cleaning and normalization may improve the accuracy and efficiency of mining algorithms.In this paper we use two data mining techniques ( neural network and decision tree ) on a known diabetic dataset to predict the future from the given attributes, and notice the impact of handling the missing value in the dataset at the results.

البيانات الطبية تمتلك معلومات كامنة لاستخلاص انماط مخبأة في قواعد البيانات. التصنيف هو شكل من تحليل البيانات لاستخلاص انماط لوصف اصناف البيانات المهمــــــة او لتخمين اتجاه البيانات المستقبلي.بعض التحليلات تساعد بتزويدنا بفهم جيد للبيانات الكبيرة التشخيص الطبي من الاعراض، هو احد الامثلة من مهمات التصنيف التي تكون فيها الاصناف الناتجــــة اما حالات المرض المختلفة او الحالة الممكنة. تنظيف البيانات وتسويتها يحسن الدقة والكفاءة في خوارزميات التنقيب. في هذا البحث تم استخدام تقنيتين (الشبكات العصبية وشجرة اتخاذ القرار) على قاعدة بيانات عالمية معروفة لمرض السكر لتخمين المستقبل من الصفات المعطاة وملاحظة اثر معالجة القيم المحذوفة بقاعـــــدة البيانات على النتائج.


Article
Employee Performance Assessment Using Modified Decision Tree

Authors: Hassan A. Jeiad --- Zinah J. M. Ameen --- Alza A. Mahmood
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2018 Volume: 36 Issue: 7 Part (A) Engineering Pages: 806-811
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

Decision tree algorithms are famous method in inductive learning and successfully applied for model classification and prediction. Performance evaluation in organization is one of the most important issues that are reliable due to the transition from industrial to knowledge age. This paper proposes the use of modified ID3 (Interactive Dichotomiser 3) decision tree algorithm combining with Taneja entropy instead of the original ID3 algorithm that depends on Shannon entropy which is widely used in the information theory. In fact, the original ID3 was suffer from complexity in the form of complex tree with large number of hops and nodes. The information gain was used as a splitting criteria of the modified ID3. The proposed modified ID3 algorithm has been tested on a dataset for a different university employees with several attributes that directly affect their annual performance assessment. The most optimized tree is constructed by taking one attribute that have the largest information gain from the dataset as a root of tree and repeating the process until the tree is completed. The results showed that the proposed modified ID3 decision tree algorithm that based on Taneja entropy gives less complexity due to small tree with three nodes and two to one hope to reach the right decision.


Article
Effect of Aging Time on Deformation Behavior of Lead-Free and Lead Base Solders Alloys

Author: Alaa H. Ali
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2018 Volume: 36 Issue: 8 Part (A) Engineering Pages: 853-866
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

The effect of aging time on the deformation behavior of lead-free and lead- based sub-mm solder alloys were investigated. Experimental results showed that the aging time (less than 4 hours) did not have any effect on the anisotropy behavior of Tin solder balls during compression processes but that is clear in other intervals time specially when the aging time increased, and the microstructure images show different grain growth in high temperature longer time and the Tin anisotropic behavior in lead-free solder alloys


Article
Application of Decision Tree as a Data Mining Tool in a health care

Authors: Sabiha Fathil Jawad صبحة فتحي جواد --- ZAKI .S. TOWFIK زكي سعيد توفيق
Journal: Journal of Kufa for Mathematics and Computer مجلة الكوفة للرياضيات والحاسوب ISSN: 11712076 Year: 2012 Volume: 1 Issue: 5 Pages: 102-109
Publisher: University of Kufa جامعة الكوفة

Loading...
Loading...
Abstract

Abstract: This work demonstrates the application of decision tree, as data mining tool, in the health care system. Data mining has the capability for classification, prediction, estimation, and pattern recognition by using health databases. Databases of health systems contain significant information for decision making. It could be properly revealed with the application of appropriate data mining techniques. Decision trees are employed for identifying valuable information in health databases. In this paper Decision tree as a data mining tools is used for predication the spread types of disease of hepatitis virus in reigns that high affect to people with different temperature and prevention of this disease by using rules that needed to predicate the diseases .


Article
Classification Algorithms for Determining Handwritten Digit

Author: Hayder Naser Khraibet AL-Behadili
Journal: Iraqi Journal for Electrical And Electronic Engineering المجلة العراقية للهندسة الكهربائية والالكترونية ISSN: 18145892 Year: 2016 Volume: 12 Issue: 1 Pages: 96-102
Publisher: Basrah University جامعة البصرة

Loading...
Loading...
Abstract

Data-intensive science is a critical science paradigm that interferes with all other sciences. Data mining (DM) is a powerful and useful technology with wide potential users focusing on important meaningful patterns and discovers a new knowledge from a collected dataset. Any predictive task in DM uses some attribute to classify an unknown class. Classification algorithms are a class of prominent mathematical techniques in DM. Constructing a model is the core aspect of such algorithms. However, their performance highly depends on the algorithm behavior upon manipulating data. Focusing on binarazaition as an approach for preprocessing, this paper analysis and evaluates different classification algorithms when construct a model based on accuracy in the classification task. The Mixed National Institute of Standards and Technology (MNIST) handwritten digits dataset provided by Yann LeCun has been used in evaluation. The paper focuses on machine learning approaches for handwritten digits detection. Machine learning establishes classification methods, such as K-Nearest Neighbor(KNN), Decision Tree (DT), and Neural Networks (NN). Results showed that the knowledge-based method, i.e. NN algorithm, is more accurate in determining the digits as it reduces the error rate. The implication of this evaluation is providing essential insights for computer scientists and practitioners for choosing the suitable DM technique that fit with their data.


Article
Medical Texture Recognition Based on Intelligent Technique
تمييز الانسجة الطبية بالاعتماد على تقنيات ذكية

Authors: Hasanen S. Abduallah --- Hajer Mazin Salih
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2016 Volume: 34 Issue: 1 Part (B) Scientific Pages: 121-128
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

The aim of this paper is to improve a disease diagnosing system through classifying the skin diseases depending on the skin images of many patients by using the multiwavelet transformation. First, extract features from multiwavelet coefficients. Second, the skin images are classified as Warts, Vitiligo, Hemangioma, and Normal depending on the decision rules generated by the decision tree using the ID3 learning algorithm.

الهدف من هذا البحث هو تحسين نظام تشخيص المرض من خلال تصنيف الأمراض الجلدية اعتمادا على صور للجلد تابع للعديد من المرضى باستخدام التحويل متعدد المويجات. أولا، يتم استخلاص ميزات الصورة من خلال معاملات التحويل متعدد المويجات. ثانيا، يتم تصنيف صور الجلد أما ان تكون مصابةبالثؤلول، البهاق، الوحمة الدموية (الورم الوعائي)، أو ان تكون بشرة طبيعية اعتمادا على قواعد اتخاذ القرارات التي تولدها شجرة القرار باستخدام خوارزمية التعلم (IterativeDichotomiser3 "ID3").


Article
Mushroom Diagnosis Assistance System Based on Machine Learning by Using Mobile Devices

Authors: Intisar Shadeed Al-Mejibli انتصار شديد المجبلي --- Dhafar Hamed Abd Dhafar Hamed Abd
Journal: Journal of Al-Qadisiyah for Computer Science and Mathematics مجلة القادسية لعلوم الحاسوب والرياضيات ISSN: 20740204 / 25213504 Year: 2017 Volume: 9 Issue: 2 Pages: 103-113 Comp
Publisher: Al-Qadisiyah University جامعة القادسية

Loading...
Loading...
Abstract

Picking the wild mushrooms from the wild and forests for food purpose or for fun has become a public issue within the last years because many types of mushrooms are poisonous. Proper determination of mushrooms is one of the key safety issues in picking activities of it, which is widely spread, in countries. This contribution proposes a novel approach to support determination of the mushrooms through using a proposed system with mobile devices. Part of the proposed system is a mobile application that easily used by a user - mushroom picker. Hence, the mushroom type determination process can be performed at any location based on specific attributes of it. The mushroom type determination application runs on Android devices that are widely spread and inexpensive enough to enable wide exploitation by users.This paper developed Mushroom Diagnosis Assistance System (MDAS) that can be used on a mobile phone. Two classifiers are used which are Naive Bays and Decision Tree to classify the mushroom types. The proposed approach selects the most effective of the already known mushroom attributes, and then specify the mushroom type. The use of specific features in mushroom determination process achieved very accurate results.

أصبح اختيار الفطر البري من البرية والغابات لغرض الغذاء أو للمتعة قضية مهمة في السنوات الأخيرة لأن العديد من أنواع الفطر سامة. التحديد السليم للفطر هو واحد من قضايا السلامة الرئيسية في فعالية انتقائه، التي تنتشر على نطاق واسع، في البلدان. تقترح هذه الورقة نهجا جديدا لدعم تحديد الفطر من خلال استخدام نظام مقترح مع الأجهزة المحمولة. جزء من النظام المقترح هو تطبيق المحمول التي تستخدم بسهولة من قبل المستخدم - ملتقط ثمارالفطر. وبالتالي، يمكن إجراء عملية تحديد نوع الفطر في أي مكان بناءا على صفات محددة منه. تطبيق تحديد نوع الفطر يعمل على أجهزة المحمول التي تنتشر على نطاق واسع وغير مكلفة بحيث يمكن استغلالها بشكل واسع من قبل المستخدمين.وضعت هذه الورقة نظام مساعدة لتشخيص الفطر (MDAS) الذي يمكن استخدامه على الهاتف المحمول. وتم استخدام اثنين من المصنفات التي هي Naive Bays و Decision Tree لتصنيف أنواع الفطر. النهج المقترح يقوم باختيار الصفات الأكثر فعالية من صفات الفطر المعروفة ، ومن ثم تحديد نوع الفطر. استخدام ميزات محددة في عملية تحديد نوع الفطر حققت نتائج دقيقة جدا.


Article
An Adaptive Intrusion Detection System by using Decision Tree
نظام كشف التسلل التكيفي باستخدام شجرة القرارات

Authors: Osamah Adil Raheem اسامة عادل رحيم --- Esraa Saleh Alomari اسراء صالح العمري
Journal: Journal of Al-Qadisiyah for Computer Science and Mathematics مجلة القادسية لعلوم الحاسوب والرياضيات ISSN: 20740204 / 25213504 Year: 2018 Volume: 10 Issue: 2 Pages: 88-96 Comp
Publisher: Al-Qadisiyah University جامعة القادسية

Loading...
Loading...
Abstract

In recent decades, data security has turned into a new vision in data innovation as the quantity of PC protection breaks are presented to an explosion in the number of security incidents. An assortment of Sequence Discovery System have been utilized for shielding PCs and systems from pernicious system based or have based assaults by utilizing conventional measurable strategies to new information mining approaches in a years ago. In any case, the present monetarily accessible interruption identification frameworks are mark based that are not equipped for identifying obscure assaults. In this paper, we introduce another learning calculation for abnormality based system interruption identification framework utilizing choice tree calculation that recognizes assaults from ordinary practices and distinguishes diverse kinds of interruptions. Test comes about on the KDD-99 bench-mark organize interruption discovery data-set exhibit that the suggested algorithm resulted 98.5% Discovery rate in comparing with other executing techniques.

في العقود الأخيرة ، تحول أمن البيانات إلى رؤية جديدة في ابتكار البيانات حيث يتم تقديم كمية من فواصل حماية الكمبيوتر الشخصي إلى انفجار في عدد الحوادث الأمنية. تم استخدام مجموعة متنوعة من نظام اكتشاف التسلسل من أجل حماية أجهزة الكمبيوتر والأنظمة من الاعتداءات الخبيثة القائمة على النظام أو التي تعتمد على النظام من خلال استخدام الاستراتيجيات التقليدية القابلة للقياس إلى أساليب التعدين الجديدة للمعلومات في السنوات الماضية. وعلى أي حال ، فإن الأطر القائمة الحالية لتحديد الهوية التي يمكن الوصول إليها بصورة نقدية تستند إلى علامة غير مجهزة للتعرف على الاعتداءات الغامضة. في هذه الورقة ، نقدم حسابًا تعليميًا آخر لإطار تعريف عدم انتظام النظام القائم على الشذوذ باستخدام حساب شجرة الاختيار الذي يعترف بالاعتداءات من الممارسات العادية ويميز الأنواع المتنوعة من الانقطاعات. يظهر الاختبار على KDD-99 تنظيم قاعدة البيانات اكتشاف تنظيم مجموعة معارض أن الخوارزمية المقترحة أسفرت عن 98.5٪ معدل اكتشاف مقارنة مع تقنيات التنفيذ الأخرى.


Article
Diabetes Classification Using ID3 and Naïve Bayes Algorithms
تصنيف مرض السكري باستخدام الخوارزمية التكرارية وخوارزمية المصنف الساذج

Authors: Khalid Shaker Jassim خالد شاكر جاسم --- Hadeel M.Saleh هديل محمد صالح
Journal: Journal of university of Anbar for Pure science مجلة جامعة الانبار للعلوم الصرفة ISSN: ISSN: 19918941 Year: 2018 Volume: 12 Issue: 3 Pages: 38-46
Publisher: University of Anbar جامعة الانبار

Loading...
Loading...
Abstract

Diabetes can be defined as a chronic disease identified by high levels of blood glucose that result from issues in the way insulin is generated, the way insulin works, or both those reasons. The aim of this research is to propose a technique using the Decision Tree (ID3) and Naive Bayes to categorize diabetes and reduce classification errors by increasing the accuracy of the classification. The results of the proposed method were evaluated by comparing them with other results through the application of the proposed system to Pima India Diabetes data set, obtained from the UCI database site. The experimental results show that the ID3 recorded a precision ratio of 91% and the naive class corrected it to 94% for the same number of the test group.

يمكن تعريف مرض السكري بأنه مرض مزمن سببه ارتفاع مستويات الجلوكوز في الدم تنتج عنه مشاكل في الطريقة التي يتم بها توليد الأنسولين، وطريقة عمل الأنسولين، أوكليهما. والهدف من هذا البحث هو اقتراح تقنية تعتمد على شجرة القرار ( ID3) ونايف بايز لتصنيف مرض السكري والحد من أخطاء التصنيف عن طريق زيادة دقة التصنيف، وتم تقييم نتائج الطريقة المقترحة عن طريق مقارنتها مع نتائج أخرى من خلال تطبيق النظام المقترح على بيانات بيما الهندية لمرض السكري والتي تم الحصول عليها من موقع الـ UCI لقواعد البيانات. وتشير النتائج التجريبية إلى أن المصنف ID3 سجل نسبة من الدقة تصل إلى 91٪ ووصلت دقه المصنف الساذج إلى 94٪ لنفس العدد من مجموعة الاختبار.

Listing 1 - 10 of 23 << page
of 3
>>
Sort by
Narrow your search

Resource type

article (23)


Language

English (20)

Arabic and English (2)


Year
From To Submit

2019 (3)

2018 (10)

2017 (4)

2016 (2)

2013 (1)

More...