TY - JOUR ID - TI - A comparison between some methods of estimating the sample size to estimate the parameters of the classification model in the case of high-dimensional data using simulations مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة(*) AU - Researcher: Balasim Saadoun Jassim الباحث: بلاسم سعدون جاسم AU - Prof. Dr. Dejela Ibrahim Mahdi أ.د. دجلة إبراهيم مهدي PY - 2020 VL - 16 IS - 50 Part 2 SP - 316 EP - 328 JO - Tikrit Journal of Administration and Economics Sciences مجلة تكريت للعلوم الإدارية والاقتصادية SN - 18131719 AB - In this research, several methods were used to determine the optimum sample size to estimate the parameters of high-dimensional data (HDD). Where the number of explanatory variables is greater than the sample size (P> n). These methods are the Bonferroni inequality method a special case of normal approximation and the Bernstein’s inequality method. The non-linear logistic regression model is estimated in the sample size of each method in the case of high-dimensional data using the artificial intelligence method, which is the artificial neural network method (ANN), as it gives a high-precision estimate commensurate with the data type and type of medical study. The probabilistic values obtained from the artificial neural network are used in the calculation of the net reclassification index. A program was written for this purpose using the statistical programming language (R) where the mean maximum absolute error criterion (MME) of the net reclassification network index (NRI) was used to compare the methods of specifying the sample size and the presence of a number of different default parameters under the given margin of error value (ε). To verify the performance of the methods using the comparison criteria above where the most important conclusions were that the Bernstein’s inequality method is the better in determining the optimal sample size according to the number of default parameters and the error margin value.

تم في هذا البحث استعمال عدة طرائق لتحديد حجم العينة الامثل لتقدير معالم البيانات ذات الابعاد العالية ((High dimensional: HDD التي يكون فيها عدد المتغيرات التوضيحية اكبر من حجم العينة . وهذه الطرائق هي طريقة متباينة بونفروني وهي حالة خاصة من التقريب الطبيعي وطريقة متباينة بيرشتاين. يتم تقدير انموذج الانحدار اللوجستي الثنائي اللاخطي بحجم عينة كل طريقة في حالة بيانات عالية الابعاد باستعمال طريقة الذكاء الاصطناعي وهي طريقة الشبكة العصبية الاصطناعية (ANN) كونها تعطي تقدير عالي الدقة بما يتناسب مع نوع البيانات ونوع الدراسة الطبية. يتم توظيف القيم الاحتمالية التي تم الحصول عليها من الشبكة العصبية الاصطناعية في حساب مؤشر اعادة التصنيف الصافي (NRI)، تم كتابة برنامج لهذا الغرض باستعماله لغة البرمجة الاحصائية (R) حيث تم الاعتماد على معيار متوسط اكبر خطا مطلق (MME) لمؤشر شبكة اعادة التصنيف الصافي (NRI) للمقارنة بين طرائق تحديد حجم العينة وبوجود عدد المعلمات الافتراضية مختلفة في ظل قيمة هامش خطا معين . للتحقق من اداء الطرائق باستعمال معايير المقارنة اعلاه حيث كانت اهم الاستنتاجات هي ان طريقة متباينة بيرشتاين هي الافضل في تحديد حجم العينة الامثل باختلاف عدد المعلمات الافتراضية وقيمة هامش الخطأ. ER -