Fulltext

Finding Accurate And Comprehensible Knowledge Discovery In Database Model

Abbas M. AL-Bakry

Journal of University of Babylon مجلة جامعة بابل
ISSN: 19920652 23128135 Year: 2013 Volume: 21 Issue: 3 Pages: 725-745
Publisher: Babylon University جامعة بابل

Abstract

Available data in scientific fields mainly consist of huge datasets which gathered by a different techniques. These data are saved in much diversified and often incompatible repositories, such of these data are in bioinformatics, geoinformatics, astroinformatics and Scientific World Wide Web sites. From the other hand, the lack of reference data is very often to give a poor performance of learning. One of the key problems in supervised learning is due to the insufficient size of the trained dataset. Therefore, we suggest developing a theoretical and practical valid tool for analyzing small of the data sample which remains as a critical and challenging issue for the researches. In this work we suggest to design and develop instructions and tools for knowledge discovery from any type of database domain, based on the state of the art information. The proposed method to construction data, determining the best features for each dataset, generating association rules then classifying and simplifying these rules.

ان البيانات المتوفرة في الحقول العلمية تتكون كم هائل من القيود والتي يتم جمعها بتقنيات مختلفة. ان هذة البيانات تحفظ بطرق غير مناسبة ومن الأمثلة على هذه البيانات ( المعرفية الحيوية والبيانات الجغرافية وايضا مواقع الشبكة العنكبوتية). ومن جانب اخر النقص في البيانات المرجعية يعطي كفائة ضعيفة للتعلم. ان المشكلة الرئيسيه في عملية التعلم بوجود المشرف يعود الى عدم كفاية البيانات المدربه. لذا تم اقتراح تطوير اداة نظرية وتطبيقية لتحليل البيانات الصغيرة والتي مازالت تمثل تحدي في المجال البحثي. ان هذه الورقة تمثل اقتراح لتصميم وتطوير ادوات وايعازات لأستكشاف البيانات من قواعد البيانات المختلفة وذلك بالأعتماد على المعلومات المهمة. الطريقة المقرحة هي في هيكلة البيانات و تحديد افضل الصفات لكل قيد بيانات وتوليد القواعد الموزعة ومن ثم تصنيف وتبسيط مجموعة القواعد الناتجة.

Keywords

: Knowledge Discovery --- Data sets --- GPDCM --- Random Forest