research centers


Search results: Found 2

Listing 1 - 2 of 2
Sort by

Article
Handling missing Data values in a Database Model using Random Forest

Author: Abbas M. AL-Bakry
Journal: Journal of University of Babylon مجلة جامعة بابل ISSN: 19920652 23128135 Year: 2012 Volume: 20 Issue: 2 Pages: 482-486
Publisher: Babylon University جامعة بابل

Loading...
Loading...
Abstract

Missing values in a databases one of critical problem faced by the researchers in Data analysis and data mining. This work presents a suggested method for handling missing data values in data sets using Random Forest (RF) Technique. The use of RF present new principles to random splitting, it alters the tree growing process by narrowing its focus during split selection. For example, if the database contains numbers of columns usable for prediction, RF would begin randomly of selection number of variables and then chooses the splitter from the list of predictors. Using the suggested method we can get the actual values for the missing records entries and handling the uncertainty and outliers problem.

تعتبر القيم المفقودة في قواعد البيانات واحده من التحديات ألمحرجه التي تواجه الباحثين في مجال تنقيب وتحليل البيانات. يعرض هذا العمل طريقه مقترحه لمعالجة قيم البيانات المفقودة باستخدام تقنية الغابات العشوائية (Random Forest). إن استخدام هذه ألطريقه وضح مبادئ جديدة للفصل العشوائي حيث يتعامل مع نمو الأشجار بتضييق البحث من خلال اختيار طريقة الفصل. وكمثال إذا كانت قاعدة البيانات تتكون من عدد من الأعمدة تستخدم للتنبؤ تبدأ هذه ألطريقه بالاختيار العشوائي لعدد من المتغيرات ومن ثم اختيار الفاصل الملائم من قائمة التنبؤات. إن استخدام هذه ألطريقه ألمقترحه يمكننا من ان نحصل على القيم الحقيقية لقيم القيود المفقودة ومعالجة مشاكل التشتت وعدم التأكيدية.


Article
Handling missing Data values in a Database Model using Random Forest

Author: Abbas M. AL-Bakry عباس محسن البكري
Journal: Journal of University of Babylon مجلة جامعة بابل ISSN: 19920652 23128135 Year: 2012 Volume: 20 Issue: 2 Pages: 482-486
Publisher: Babylon University جامعة بابل

Loading...
Loading...
Abstract

Missing values in a databases one of critical problem faced by the researchers in Data analysis and data mining. This work presents a suggested method for handling missing data values in data sets using Random Forest (RF) Technique. The use of RF present new principles to random splitting, it alters the tree growing process by narrowing its focus during split selection. For example, if the database contains numbers of columns usable for prediction, RF would begin randomly of selection number of variables and then chooses the splitter from the list of predictors. Using the suggested method we can get the actual values for the missing records entries and handling the uncertainty and outliers problem.

تعتبر القيم المفقودة في قواعد البيانات واحده من التحديات ألمحرجه التي تواجه الباحثين في مجال تنقيب وتحليل البيانات. يعرض هذا العمل طريقه مقترحه لمعالجة قيم البيانات المفقودة باستخدام تقنية الغابات العشوائية (Random Forest). إن استخدام هذه ألطريقه وضح مبادئ جديدة للفصل العشوائي حيث يتعامل مع نمو الأشجار بتضييق البحث من خلال اختيار طريقة الفصل. وكمثال إذا كانت قاعدة البيانات تتكون من عدد من الأعمدة تستخدم للتنبؤ تبدأ هذه ألطريقه بالاختيار العشوائي لعدد من المتغيرات ومن ثم اختيار الفاصل الملائم من قائمة التنبؤات. إن استخدام هذه ألطريقه ألمقترحه يمكننا من ان نحصل على القيم الحقيقية لقيم القيود المفقودة ومعالجة مشاكل التشتت وعدم التأكيدية.

Listing 1 - 2 of 2
Sort by
Narrow your search

Resource type

article (2)


Language

English (2)


Year
From To Submit

2012 (2)