research centers


Search results: Found 3

Listing 1 - 3 of 3
Sort by

Article
Handling missing Data values in a Database Model using Random Forest

Author: Abbas M. AL-Bakry
Journal: Journal of University of Babylon مجلة جامعة بابل ISSN: 19920652 23128135 Year: 2012 Volume: 20 Issue: 2 Pages: 482-486
Publisher: Babylon University جامعة بابل

Loading...
Loading...
Abstract

Missing values in a databases one of critical problem faced by the researchers in Data analysis and data mining. This work presents a suggested method for handling missing data values in data sets using Random Forest (RF) Technique. The use of RF present new principles to random splitting, it alters the tree growing process by narrowing its focus during split selection. For example, if the database contains numbers of columns usable for prediction, RF would begin randomly of selection number of variables and then chooses the splitter from the list of predictors. Using the suggested method we can get the actual values for the missing records entries and handling the uncertainty and outliers problem.

تعتبر القيم المفقودة في قواعد البيانات واحده من التحديات ألمحرجه التي تواجه الباحثين في مجال تنقيب وتحليل البيانات. يعرض هذا العمل طريقه مقترحه لمعالجة قيم البيانات المفقودة باستخدام تقنية الغابات العشوائية (Random Forest). إن استخدام هذه ألطريقه وضح مبادئ جديدة للفصل العشوائي حيث يتعامل مع نمو الأشجار بتضييق البحث من خلال اختيار طريقة الفصل. وكمثال إذا كانت قاعدة البيانات تتكون من عدد من الأعمدة تستخدم للتنبؤ تبدأ هذه ألطريقه بالاختيار العشوائي لعدد من المتغيرات ومن ثم اختيار الفاصل الملائم من قائمة التنبؤات. إن استخدام هذه ألطريقه ألمقترحه يمكننا من ان نحصل على القيم الحقيقية لقيم القيود المفقودة ومعالجة مشاكل التشتت وعدم التأكيدية.


Article
Handling missing Data values in a Database Model using Random Forest

Author: Abbas M. AL-Bakry عباس محسن البكري
Journal: Journal of University of Babylon مجلة جامعة بابل ISSN: 19920652 23128135 Year: 2012 Volume: 20 Issue: 2 Pages: 482-486
Publisher: Babylon University جامعة بابل

Loading...
Loading...
Abstract

Missing values in a databases one of critical problem faced by the researchers in Data analysis and data mining. This work presents a suggested method for handling missing data values in data sets using Random Forest (RF) Technique. The use of RF present new principles to random splitting, it alters the tree growing process by narrowing its focus during split selection. For example, if the database contains numbers of columns usable for prediction, RF would begin randomly of selection number of variables and then chooses the splitter from the list of predictors. Using the suggested method we can get the actual values for the missing records entries and handling the uncertainty and outliers problem.

تعتبر القيم المفقودة في قواعد البيانات واحده من التحديات ألمحرجه التي تواجه الباحثين في مجال تنقيب وتحليل البيانات. يعرض هذا العمل طريقه مقترحه لمعالجة قيم البيانات المفقودة باستخدام تقنية الغابات العشوائية (Random Forest). إن استخدام هذه ألطريقه وضح مبادئ جديدة للفصل العشوائي حيث يتعامل مع نمو الأشجار بتضييق البحث من خلال اختيار طريقة الفصل. وكمثال إذا كانت قاعدة البيانات تتكون من عدد من الأعمدة تستخدم للتنبؤ تبدأ هذه ألطريقه بالاختيار العشوائي لعدد من المتغيرات ومن ثم اختيار الفاصل الملائم من قائمة التنبؤات. إن استخدام هذه ألطريقه ألمقترحه يمكننا من ان نحصل على القيم الحقيقية لقيم القيود المفقودة ومعالجة مشاكل التشتت وعدم التأكيدية.


Article
Comparison between Rush Model Parameters to Completed and Lost Data by Different Methods of Processing Missing Data
المقارنة بين تقديرات معالم انموذج راش للبيانات الكاملة والمفقودة باختلاف طرق معالجة البيانات المفقودة

Author: M . Dr. Nawal Jabbar Saleh 2019 نوال جبار صالح
Journal: Journal Of Educational and Psychological Researches مجلة البحوث التربوية والنفسية ISSN: 18192068 /pissn 26635879 Year: 2019 Volume: 16 Issue: 63 Pages: 429-466
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

The current study aims to compare between the assessments of the Rush model’s parameters to the missing and completed data in various ways of processing the missing data. To achieve the aim of the present study, the researcher followed the following steps: preparing Philip Carter test for the spatial capacity which consists of (20) items on a group of (250) sixth scientific stage students in the directorates of Baghdad Education at Al–Rusafa (1st, 2nd and 3rd) for the academic year (2018-2019). Then, the researcher relied on a single-parameter model to analyze the data. The researcher used Bilog-mg3 model to check the hypotheses, data and match them with the model. In addition, the researcher relied on chi-squared value for each item at (0.05). After that, the researcher found out the parameters of the missing data after relying on a loss percentage (10%) and used three ways to treat them (mean, regression, likelihood). The results showed that the comparison between the parameters completed and missing data by using three ways of processing the missing data is in favor of the parameters of the completed data, and the likelihood way is the suitable way to treat the completed data. The conclusions, recommendations and suggestions have been drawn based on the findings.

هدف البحث الحالي إلى المقارنة بين تقديرات معالم انموذج راش للبيانات الكاملة والمفقودة باختلاف طرق معالجة البيانات المفقودة ، ولتحقيق هدف البحث اتبعت الباحثة مجموعة خطوات علمية في إعداد البحث . اذ قامت بأعداد اختبار القدرة المكانية لكارتر(2007) المتكون من (20) مفردة على مجموعة من الطلبة عددهم (250 ) من طلبة السادس العلمي التابعين الى مديريات تربية بغداد الرصافة (1 ,2 ,3) للعام الدراسي (2018-2019) ، واعتمدت الباحثة على الانموذج احادي البارامتر لتحليل بيانات البحث. اذ تحققت من افتراضات وملائمة البيانات للأنموذج باستخدام برنامج (Bilog-mg3) , واعتمدت على قيمة مربع ( كاي) لكل فقرة عند (0,05)للتحقق من مدى ملائمة فقرات الاختبار للانموذج.ثم قامت الباحثة باستخراج معالم الفقرات للبيانات المفقودة بعد اعتماد نسبة فقد (10%) ومعالجتها بثلاث طرق (المتوسط , الانحدار , الارجحية). وبعد اجراء المقارنة بين معالم البيانات الكاملة والمفقودة باستخدام ثلاث طرق لمعالجة البيانات المفقودة , اظهرت النتائج افضلية معالم البيانات الكاملة على البيانات المفقودة المعالجة , وان طريقة الارجحية كانت اقرب طريقة معالجة من البيانات الكاملة . و صاغت الباحثة استنتاجات وتوصيات ومقترحات بالاستناد على ما استخرجته من نتائج.

Listing 1 - 3 of 3
Sort by
Narrow your search

Resource type

article (3)


Language

English (2)

Arabic (1)


Year
From To Submit

2019 (1)

2012 (2)