@Article{, title={Spam Filtering Approach based on Weighted Version of Possibilistic c-Means اسلوب لتصفية البريد المزعج اعتمادا على نسخة موزونه من Possibilistic c-Means}, author={Sarab M. Hameed سراب مجيد حميد and Marwan B. Mohammed مروان بدران محمد}, journal={Iraqi Journal of Science المجلة العراقية للعلوم}, volume={58}, number={2C}, pages={1112-1127}, year={2017}, abstract={A principal problem of any internet user is the increasing number of spam, which became a great problem today. Therefore, spam filtering has become a research fo-cus that attracts the attention of several security researchers and practitioners. Spam filtering can be viewed as a two-class classification problem. To this end, this paper proposes a spam filtering approach based on Possibilistic c-Means (PCM) algorithm and weighted distance coined as (WFCM) that can efficiently distinguish between spam and legitimate email messages. The objective of the formulated fuzzy problem is to construct two fuzzy clusters: spam and email clusters. The weight assignment is set by information gain algorithm. Experimental results on spam based benchmark dataset reveal that proper setting of feature-weight can improve the performance of the proposed spam filtering approach. Furthermore, the proposed spam filtering approach performance is better than PCM and Naïve Bayes filtering technique.

المشكلة الرئيسية لمستخدمي الانترنت هو العدد المتزايد من البريد المزعج، والتي أصبحت مشكلة كبيرة اليوم. لذلك، أصبحت البحوث تركزعلى تصفية الرسائل غير المرغوب فيها والتي جذبت انتباه العديد من باحثين الامنية. يمكن اعتبار عملية تصفية البريد المزعج كمشكلة لتصنيف مجموعتين هذا البحثيقترح نهج لتصفية البريد المزعج على أساس Possibilistic c-Means والمسافة الموزنه التي يمكن أن تميز بكفاءة بين البريد المزعج والبريد الإلكتروني الشرعي. إن الهدف من استخدام خوارزمية التجمع الضبابي في الكشف هو تكوين مجموعتين من التجمع الضبابي هما: مجموعة البريد المزعج و مجموعة الرسائل الالكترونية. تحديد الوزن يتم عن طريق خوارزمية كسب المعلومات. النتائج التجريبية على مجموعة بيانات البريد المزعج القياسية اظهرت أن تحديد الوزن المناسب الى كل ميزة يمكن أن يحسن من أداء نهج تصفية البريد المزعج المقترحة. وعلاوة على ذلك، فإن أداء نهج تصفية المزعج المقترح هو أفضل من تقنية تصفية المزعج PCM وتقنية بايز البسيطة.} }