TY - JOUR ID - TI - Feature Selection based on Genetic Algorithm for Classification of Mammogram Using K-means, k-NN and Euclidean Distance AU - Kameran Adil Ibrahim كامران عادل ابراهيم PY - 2017 VL - 22 IS - 9 SP - 106 EP - 112 JO - Tikrit Journal of Pure Science مجلة تكريت للعلوم الصرفة SN - 18131662 24151726 AB - There have been several supervised classification attempts for mammograms in the recent times, but very few research works have focused on unsupervised classification to explore its potentialities and weaknesses. I have in this paper attempted to utilize unsupervised clusters to classify malignant, and benign mammograms samples. MiniMIAS database has total 322 mammogram images out which 64 are benign and 51 are malignant. I used 115 images for my experimentation i.e. 64 benign and 51 malignant. Out of these 115, 60% were used for training and 40% for testing. Therefore from 64 benign cases 39 images were used for training and rest for testing, and out of 51 malignant cases 31 images were used for training and rest for testing., the classifications was done on the bases of the features selected using genetic algorithm. Attempts have also been made to study the performance of each feature selected by Genetic Algorithm (GA) in classification. The initially identified clusters using K-means are used to classify 60 unknown samples using k-NN. The proposed work got reasonably good results with 96.23% accuracy for malignant samples, 95.37% for benign. The proposed work can help the radiologists and oncologist as second opinion during screening sessions for early detection.

كانت هناك عدة محاولات تصنيف رقابية لتصوير الثدي بالأشعة السينية في الآونة الأخيرة، ولكن عدد قليل جدا من الاعمال البحثية ركزت على تصنيف غير خاضع للرقابة لاستكشاف إمكانيتها ونقاط ضعفها. لقد حاولت في هذا البحث الاستفادة من المجموعات الغير الخاضعة للرقابة لتصنيف الورم الخبيث والحميد، جمعية تحليل تصوير الثدي بالأشعة (MiniMIAS) لديها 322 تصوير للثدي بالأشعة، منها 64 حميدة و51 خبيثة. استخدمت 115 صورة للتجربة اي 64 حميد و51 خبيث من بين هذه 115 صورة تم استخدام %60 للتدريب و %40 للاختبار. لذلك من 64 حالة حميدة تم استخدام 39 صورة للتدريب والبقية للاختبار, ومن اصل 51 حالة خبيثة تم استخدام 31 صورة للتدريب والبقية الاختبار. التصنيف كان على اساس الميزات المختارة باستخدام الخوارزمية الجينية. كما اجريت تجارب لدراسة اداء كل ميزة مختارة من قبل الخوارزمية الجينية في التصنيف. المجموعات التي تم تحديدها في البداية استخدمت (K-means) لتصنيف 60 عينة غير معروفة مستخدما K-NN. لقد حصل العمل المقترح على نتائج عالية من الدقة96.23% للعينات الورمية الخبيثة،95.37% للحميدة. هذا العمل المقترح يُساعد أطباء الأشعة والأورام كمقترح ثان خلال جلسات الفرز للكشف المبكر. ER -