TY - JOUR ID - TI - Handling missing Data values in a Database Model using Random Forest AU - Abbas M. AL-Bakry عباس محسن البكري PY - 2012 VL - 20 IS - 2 SP - 482 EP - 486 JO - Journal of University of Babylon مجلة جامعة بابل SN - 19920652 23128135 AB - Missing values in a databases one of critical problem faced by the researchers in Data analysis and data mining. This work presents a suggested method for handling missing data values in data sets using Random Forest (RF) Technique. The use of RF present new principles to random splitting, it alters the tree growing process by narrowing its focus during split selection. For example, if the database contains numbers of columns usable for prediction, RF would begin randomly of selection number of variables and then chooses the splitter from the list of predictors. Using the suggested method we can get the actual values for the missing records entries and handling the uncertainty and outliers problem.

تعتبر القيم المفقودة في قواعد البيانات واحده من التحديات ألمحرجه التي تواجه الباحثين في مجال تنقيب وتحليل البيانات. يعرض هذا العمل طريقه مقترحه لمعالجة قيم البيانات المفقودة باستخدام تقنية الغابات العشوائية (Random Forest). إن استخدام هذه ألطريقه وضح مبادئ جديدة للفصل العشوائي حيث يتعامل مع نمو الأشجار بتضييق البحث من خلال اختيار طريقة الفصل. وكمثال إذا كانت قاعدة البيانات تتكون من عدد من الأعمدة تستخدم للتنبؤ تبدأ هذه ألطريقه بالاختيار العشوائي لعدد من المتغيرات ومن ثم اختيار الفاصل الملائم من قائمة التنبؤات. إن استخدام هذه ألطريقه ألمقترحه يمكننا من ان نحصل على القيم الحقيقية لقيم القيود المفقودة ومعالجة مشاكل التشتت وعدم التأكيدية. ER -