research centers


Search results: Found 1

Listing 1 - 1 of 1
Sort by

Article
A Wavelet Neural Network Ramwork for Speaker Idntifcation

Authors: Saleem M-R. Taha --- Dhiadeen M. Salih --- W.A. Mahmoud
Journal: Journal of Engineering مجلة الهندسة ISSN: 17264073 25203339 Year: 2006 Volume: 12 Issue: 1 Pages: 227-236
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

This paper introduces a new model-free identification methodology to detect and identify speakers and recognize them. The basic module of the methodology is a novel multi-dimensional wavelet neural network . The WNN approach include: a universal approximator ; the time – frequency localization : property of wavelets leads to reduced networks at a given level of performance ; The construct used as the feature mode classifier . Wavelet transform has been successfully applied to the processing of non – stationary speech signal and the feature vector that obtained becomes the input to the wavelet neural network which is trained off-line to map features to used for the classification procedure. An example is employed to illustrate the robustness and effectiveness of proposed scheme.

في هذا البحث تم اقتراح طريقة لنظام تمييز تعتمد على شبكة عصبية للتحويل المتموج ذات الابعاد (wavelet neural network) حيث ان نظرية (WN) يتضمن التحديد الزمني والترددي والتابع للتحويل التموجي مساعدا بتقليل نسبة تعقيد الشبكة وعلى الاساس استخدم هذه الشبكة كمصنف لخصائص لنماذج معينة من صوت كل متكلم حيث يستخلص بطريقة التحويل المتموج المتقطع (Discreet wavelet transform) لعدة مستويات بعد تقسيم كل صوت الى عدد من مقاطع متساوية ومن ثم اخذ الطاقة المعدلة لكل مستوى حيث يتحصل بذلك على متجه ذات معاملات تدل لخصائص الكلمة للمتكلم وبعده يطبق جميع المتجهات المستحصلة لكل متكلم على شبكة التحويل المتموج (WN) وذلك لغرض تعليم الشبكة (Learning face) ومن ثم تطبيق صوت متكلم مجهول على الشبكة للتعرف عليه وقد اعطىت هذه الطريقة عدد اوطىء من الحسابات وبذلك يزيد من كفاءة النظام ويقلل من وقت التنفيذ مقارنة لبقية الشبكات العصبية المستخدمة سابقا. هذه الطريقة تم تطبيقها على حاسبة سرعة معالجها (850 MHz Celeron) و(RAM 128 MB) ولغة برنامج هي MATLTAB 6 . اما قاعدة البيانات فهي مكونة من خمسة وعشرين شخص (12 ذكور و 13 اناث) وقد كانت نسبة التمييز هي 82% مع زمن تعلم للشبكة لايتجاوز 47 ثانية في حالة النص المستقل ونسبة 100% مع زمن تعلم للشبكة تصل الى 155 ثانية في حالة النص المتعمد

Listing 1 - 1 of 1
Sort by
Narrow your search

Resource type

article (1)


Language

English (1)


Year
From To Submit

2006 (1)