TY - JOUR ID - TI - Content-Based Audio Retrieval by using Elitism GA-KNN Approach استرجاع الصوت بالاعتماد على المحتويات باستخدام اسلوب النخبية GA-KNN AU - Sarah Hussein Toman سارة حسين تومان AU - Muna Ghazi Abdul Sahib منى غازي صاحب AU - Zinah Hussein Toman زينة حسين تومان PY - 2017 VL - 9 IS - 1 SP - 153 EP - 168 JO - Journal of Al-Qadisiyah for Computer Science and Mathematics مجلة القادسية لعلوم الحاسوب والرياضيات SN - 20740204 25213504 AB - The digital audio became very popular and important in a computer user experience. The increasing amounts of audio data requires improvement, new methods and algorithms for processing this information. In this paper, our approach proposed the GA-KNN approach (Genetic Algorithm with K-Nearest Neighbor as fitness function) for content-based audio retrieval. The input is an audio file (query) and the output is a list of audio files ranked by their similarity. The system first extracts the features from an audio database and audio query. The query pattern is considered as a boundary for comparison. Then, the initial population in a genetic algorithm is constructed from a database containing all audio features. To improve the results, this paper uses Cosine measure in the genetic algorithm, and an improved selection method selection method to prevent the fittest chromosomes from being wasted in the new population by adding an Elitism feature, using 4% Elitism count. Furthermore, we proposed a new crossover method (Close Up-Feature Crossover) to create a new offspring by comparison between two audio patterns to query pattern. Finally, we evaluated our approach using a well-known audio database, which contains 409 sound samples of 16 classes to give 0.71475 as a precision of the audio retrieval.

الصوت الرقمي شائعة جدا ومهمة في تجربة مستخدم الكمبيوتر. تتطلب الكميات المتزايدة من البيانات الصوتية تحسين طرق وخوارزميات جديدة لمعالجة هذه المعلومات. الطريقة المقترحة تستخدم طريقة GA-KNN( الخوارزمية الجينية مع الجارK الأقرب كدالة الافضل) لاسترجاع محتوى الملفات الصوتية. المدخل هو الملف الصوتي (الاستعلام) والمخرجات هي قائمة من الملفات الصوتية التي تكون متدرجة على اساس تشابهها. بالبداية, النظام يستخلص الخصائص ذات الصلة من قاعدة بيانات واستعلام الصوت ثم يعتبر نمط الاستعلام كحد للمقارنه. انشاء العناصر الأولية من قاعدة بيانات جميع خصائص الصوت. ومع ذلك، فإن مقياس التشابه الذي أساسها المسافة الإقليدية بين أنماط الصوت إلى الاستعلام يعاني من مشاكل: نتائج الاسترجاع المقابلة لأنماط الاستعلام المختلفة داخل نفس الفئة قد تكون تختلف كثيرا وسوف يكون متوسط دقة الاسترجاع منخفضة, لذلك في هذا البحث يستخدم قياس جيب التمام في KNN . تم تحسين طريقة الاختيار لمنع الكروموسومات الافضل من ان تفقد في العناصر الجديدة، وذلك بإضافة ميزة النخبوية, 4٪ النخبية. اقتراح طريقة تقاطع جديدة (تقاطع الخاصية الاقرب) بواسطة المقارنة بين انماط الصوت ونمط الاستعلام . وأخيرا تم تقييم اسلوبنا باستخدا قاعده بيانات شائعه للصوت تتالف من 400 صوت و 16 صنف وكانت دقة الاسترجاع هي 0.71475 ER -