Article
Comparison between some of linear classification models with practical application
مقارنه بين بعض طرائق التصنيف الخطية مع تطبيق عملي

Journal: journal of Economics And Administrative Sciences مجلة العلوم الاقتصادية والإدارية ISSN: 2227 703X / 2518 5764 Year: 2014 Volume: 20 Issue: 80 Pages: 339-410

Abstract

Linear discriminant analysis and logistic regression are the most widely used in multivariate statistical methods for analysis of data with categorical outcome variables .Both of them are appropriate for the development of linear classification models .linear discriminant analysis has been that the data of explanatory variables must be distributed multivariate normal distribution. While logistic regression no assumptions on the distribution of the explanatory data. Hence ,It is assumed that logistic regression is the more flexible and more robust method in case of violations of these assumptions.In this paper we have been focus for the comparison between three forms for classification data belongs two groups when the response variable with tow categorise only.The first form is the linear discriminant function ,The second is the probability form which it is derivative as alternative for the linear discriminant function while the third form is the probability function model. Of the logistic regression the comparison between these methods is based on measure of the probability of misclassification .We show that the results of the probability form of the logistic regression has minimum probability of misclassification through the application on the data of two types of (leukemia).

يعد تحليل التمييز الخطي والانحدار اللوجستي من أهم طرائق التحليل الإحصائي متعدد المتغيرات استخداماً في مجال تحليل البيانات المصنفه (Categorical data) واللذين يمكن عدهما تطويراً لنماذج التصنيف الخطية .ان استخدام تحليل التمييز الخطي يتطلب ان تكون بيانات المتغيرات التوضيحية ذات توزيع طبيعي متعدد المتغيرات.في حين الانحدار اللوجستي لايشترط ايه افتراضات تخص توزيع المتغيرات التوضيحيه، اذ يعد الانحدار اللوجستي أكثر مرونه وأكثر حصانه في حاله عدم تحقق الافتراضات الأساسية للتحليل التمييزي الخطي. في هذا البحث تم التركيز على أجراء مقارنات بين ثلاث صيغ لتصنيف بيانات تعود لمجموعتين في حاله متغير الاستجابة مؤلف من مستتويين ( تصنيفين) فقط ، الصيغه الأولى كانت دالة التمييز الخطي في حالة المجموعتيين تتبعان التوزيع الطبيعي متعدد المتغيرات والثانيه فكانت الصيغه الاحتماليه التي اشتقت كبديل لدالة التمييز الخطي ،اما الثالثة فكانت الصيغه الاحتمالية لنموذج الانحدار اللوجستي ثنائي الاستجابه وتمت المقارنة بين هذه الصيغ الثلاثة على وفق معيار احتمال خطأ التصنيف(Misclassification) . واثبتت النتائج ان التصنيف بحسب الصيغة الاحتمالية لنموذج الانحدار اللوجستي تعطي أقل احتمال لخطأ التصنيف من خلال التطبيق على بيانات تخص نوعين من امراض سرطان الدم( اللوكيميا) .

Article
Determine the most important factors affecting liver cancer i n Iraq for the year 2017
تحديد أهم العوامل المؤثرة على مرض سرطان الكبد في العراق للعام 2017

Author: م.د. غياث حميد مجيد
Journal: journal of the college of basic education مجلة كلية التربية الاساسية ISSN: 18157467(print) 27068536(online) Year: 2019 Volume: 25 Issue: 105 العلمي Pages: 195-204
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Abstract

The logistic regression is one of the most important elements of linear modeling. It is one of the most statistical methods used in the analysis of classified data and does not assume any conditions for the distribution of independent variables. Logistic regression is used to predict the probability of a particular event in many different fields, including medical, economic, social sciences and other fields that require predicting the tendency of people to make decisions about current study. This type of regression is flexible, giving a clear explanation for the relationship between the dependent variable and the explanatory variables.The study examined the use of logistic regression to determine the most important factors and variables affecting patients with liver cancer in Iraq for the year 2017, by analyzing the relationship between variables and access to variables that affect of this type of cancer. One of the most important conclusions reached by the researcher is to identify the most important factors affecting liver cancer and the cause of the disease in order to avoid the incidence of such a type of disease.

يعد الانحدار اللوجستي أحد أهم عناصر النمذجة الخطية وهو من أكثر الأساليب الاحصائية استخداماً في مجال تحليل البيانات المصنفة ولا يفترض أي شروط حول توزيع المتغيرات المستقلة. يستخدم الانحدار اللوجستي لأغراض التنبؤ باحتمالية وقوع حدث معين ويتم استخدامه في الكثير من المجالات المختلفة منها الطبية والاقتصادية والعلوم الاجتماعية وغيرها من المجالات المختلفة التي تتطلب توقع ميل الأشخاص في اتخاذ القرار حول الدراسة قيد البحث. ويتسم هذا النوع من أنواع الانحدار بالمرونة إذ يعطي تفسيراً واضحاً لوصف لعلاقة ما بين المتغير التابع والمتغيرات التوضيحية.تناول البحث استخدام الانحدار اللوجستي لتحديد أهم العوامل والمتغيرات المؤثرة على المصابين بمرض سرطان الكبد في العراق للعام 2017، وذلك بتحليل العلاقة بين المتغيرات والوصول إلى المتغيرات التي تؤثر على الاورام السرطانية الخاصة بهذا النوع من المرض. ومن أهم الاستنتاجات التي تم التوصل إليها من الباحث التعرّف على أهم العوامل المؤثرة على مرض سرطان الكبد والمسببة للمرض لغرض تجنب الاصابة بمثل هكذا نوع من الأمراض.

Article
تقنية الانحدار اللوغاريتمي ثنائي الاستجابة لتحديد المتغيرات المؤثرة على كفاية الدخل الشهري للعائلة العراقية دراسة تطبيقية لعينة طبقية عشوائية في مدينة بغداد

Author: أستاذ مساعد دكتور فيصل ناجي نامق
Journal: Journal of Baghdad College of Economic sciences University مجلة كلية بغداد للعلوم الاقتصادية الجامعة ISSN: 2072778X Year: 2016 Issue: 47 Pages: 131-148
Publisher: Baghdad College of Economic Sciences كلية بغداد للعلوم الاقتصادية

Abstract

For the purpose of determining the variables that affect the adequacy of the monthly income of the Iraqi family and a statement of any of these variables have the greatest importance in influencing and grading according to their impact to satisfy the basic needs of the Iraqi family has been used logistic regression technique (Logistic Regression) binary response included a sample search on the study (200) Iraqi family pulled randomly from four different zonal level layers of metal which Shi (Mansour district, al-Obeidi neighborhood, ur neighborhood, neighborhood Flame) in the city of Baghdad has addressed research study of eight independent variables (Independence Variable) type of binary response (Binary Response ) and then test the hypothesis Search Home (H0) for the independent variables according to the hypothesis, which states that no significant effect transactions on the monthly income of the Iraqi family, as follows: Ho: - bi = 0 i = 1,2,3,4, ......... 8 Where the (bi) refers to the regression coefficients for independent variablesVersus the alternative hypothesis H1)), which states sign by the impact of these factors and the level of significance (0.05) and are as follows H1: - bi ≠ 0 i = 1,2,3 ......... 8The researcher found the following results1-The moral effect factor (x8), which represents the fact that the monthly income of the family is less than 500 thousand Dinars a month and ranked first influence was the moral level( sig = 0) and the value of Laboratories have reached (2.781).2- The second factor influencing sign by (x3), which represents the amount of the allocation for rent monthly income of any other words, the lack of housing ownership was moral level ( sig = 0) and the parameter value has been reached (-2.319).3-The third factor influencing sign by (x4), which represents the presence of students in universities and deduct part of the family's monthly income to help them and the level of moral ) sig = 0( The parameter value has reached (-2.144).4- In the fourth place sign by impact factor (x6), which represents the deduction of part of the family's monthly income as wages and transfer was the moral level sig = 0.001)) and the parameter value has reached) 1.514).5- In the fifth place sign by impact factor (x1), which represents the fact that the family is composed of four or more persons was the moral level sig = 0.028)) and the parameter value has reached(1.006) .6- The rest of the variables ((x2, x5, x7) (there are more than adequate resource = x2, working in the private sector = x5, receipt of the family to support food = x7) has proved not to Manuetha in effect.

لغرض تحديد المتغيرات التي تؤثر على كفاية الدخل الشهري للعائلة العراقية وبيان أي من هذه المتغيرات له الاهمية الاكبر في التأثير وتدريجها حسب تأثيرها لاشباع الحاجات الاساسية للعائلة العراقية فقد تم أستخدام تقنية الانحدار اللوجستي (Logistic Regression) ثنائي الاستجابة وقد اشتملت عينة البحث على دراسة (200) عائلة عراقية سحبت بشكل عشوائي من اربع طبقات مناطقية مختلفة بالمستوى المعا شي وهي (حي المنصور,حي العبيدي , حي اور,حي الشعله ) في مدينة بغداد وقد تناول البحث دراسة ثمانية متغيرات مستقلــة (Independence Variable) من النوع الثنائي الاستجابة (Binary Response) ومن ثم أختبار فرضية البحث الرئيسية (H0) الخاصة بالمتغيرات المستقلة وفق الفرضية التي تنص على عدم معنوية المعاملات بالتأثير على الدخل الشهري للعائلة العراقية وكما يلي : Ho:- bi = 0 i= 1,2,3,4,………8حيث ان (bi) تشير الى معاملات الانحدار للمتغيرات المستقلة مقابل الفرضية البديلةH1)) التي تنص بمعنوية التأثير لهذه العوامل وبمستوى معنوية (0.05) وعلى النحو الاتي H1 : - bi ≠ 0 i=1,2,3………8 وتوصل الباحث الى النتائج الاتية 1- معنوية تأثير العامل ( x8 ) الذي يمثل كون الدخل الشهري للعائلة أقل من ( 500 ) الف دينار شهريا وأحتل المرتبة الاولى بالتأثير وكان مستوى المعنوية sig = 0) ) وقيمة المعامل قد بلغت( 2.781 ) .2- في المرتبة الثانية بمعنوية التأثير العامل( x3 ) الذي يمثل تخصيص مبلغ للايجار من الدخل الشهري أي بمعنى أخر عدم ملكية السكن وكان مستوى المعنوية sig = 0) ) وقيمة المعامل قد بلغت ( -2.319 ) .3- في المرتبة الثالثة بمعنوية التأثير العامل ( x4 ) الذي يمثل وجود طلبة في الجامعات وتستقطع العائلة جزء من الدخل الشهري لأعانتهم وكان مستوى المعنوية sig = 0) ) وقيمة المعامل قد بلغت ( -2.144 ) . 4- في المرتبة الرابعة بمعنوية التأثير العامل ( x6 ) الذي يمثل أستقطاع العائلة جزء من الدخل الشهري كأجور نقل وكان مستوى المعنوية sig = 0.001) ) وقيمة المعامل قد بلغت (1.514) . 5- في المرتبة الخامسة بمعنوية التأثير العامل ( x1 ) الذي يمثل كون العائلة متكونة من اربعة أشخاص فأكثر وكان مستوى المعنوية sig = 0.028) ) وقيمة المعامل قد بلغت (1.006) .6- أما بقية المتغيرات ((x2,x5,x7 ) ( وجود أكثر من مورد معيشي = x2 , العمل لدى القطاع الخاص = x5 أستلام العائلة لدعم المواد الغذائية = x7 ) فقد اثبتت عدم معنويتها في التأثير .

