research centers


Search results: Found 4

Listing 1 - 4 of 4
Sort by

Article
Using Neural Network with Speaker Applications
استخــدام الشبكات العصبيــة مع تطبيقــات المتكــلم

Authors: Samira faris khlibs سميرة فارس خليبص --- Alaa noori mazher علاء نوري مزهر
Journal: Baghdad Science Journal مجلة بغداد للعلوم ISSN: 20788665 24117986 Year: 2010 Volume: 7 Issue: 2 Pages: 1076-1081
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

In Automatic Speech Recognition (ASR) the non-linear data projection provided by a one hidden layer Multilayer Perceptron (MLP), trained to recognize phonemes, and has previous experiments to provide feature enhancement substantially increased ASR performance, especially in noise. Previous attempts to apply an analogous approach to speaker identification have not succeeded in improving performance, except by combining MLP processed features with other features. We present test results for the TIMIT database which show that the advantage of MLP preprocessing for open set speaker identification increases with the number of speakers used to train the MLP and that improved identification is obtained as this number increases beyond sixty. We also present a method for selecting the speakers used for MLP training which further improves identification performance.

في عمليات تمييز الكلام(ASR) , توجه البيانات اللاخطية الناتجة من طبقة مخفية من طبقات (MLP) , لتميز إحدى وحدات الكلام الصغرى (Phonemes) , لتحسين الخصائص التي تزيد من أداء إل (ASR) خصوصا بوجود الضوضاء. وفي المحاولات السابقة التي طبقت لتمييز الكلام لم تنجح في تحسين الأداء باستثناء الدمج ما بين خصائص المعالجة بوساطة (MLP) مع خصائص أخرى. لقد عرضنا نتائج اختبارات لقاعدة بيانات (TIMIT) والتي بينت فوائد المعالجة الأولية ل (MLP) باتجاه تعريف مجموعة من المتكلمين وذلك بزيادة عدد المتكلمين المستخدمين لتدريب إل (MLP) عن إل (60)التي تمكنت من تحسين الأداء. كذلك بينا طريقة لاختيار المتكلمين المستخدمين لتدريب إل (MLP) والتي أعطت بعدا أكثر في أيجاد التماثل.


Article
Speaker Recognition Based on Semantic Indexing
تمييز أصوات المتكلمين بناءا على الارشفة الدلالية

Authors: Mohammed Sahib Altaei --- Khamail Abbas --- Marwa Jawad
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2011 Volume: 29 Issue: 5 Pages: 935-947
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

In this paper, a new pitch extraction method is established to be employed inimproving the performance of the eigenvoices problem. This required indexing thepitch of the voice in a document matrix and then mapping the voice documents intopreserved semantic features. The proposed voice recognition system was built to beoperated in two phases; enrollment and recognition. Closed dataset of differentvoices belong to different sexes and ages of speakers were enrolled in the firstphase. The results of the recognition phase were promising of about 81% for bothsexes. This ensures the successful recognition task and the efficiency of theproposed system.


Article
Advantages and Disadvantages of Automatic Speaker Recognition Systems

Authors: Rawia Ab. Mohammed --- Akbas E. Ali --- Nidaa F. Hassan
Journal: Journal of Al-Qadisiyah for Computer Science and Mathematics مجلة القادسية لعلوم الحاسوب والرياضيات ISSN: 20740204 / 25213504 Year: 2019 Volume: 11 Issue: 3 Pages: Comp Page 21-30
Publisher: Al-Qadisiyah University جامعة القادسية

Loading...
Loading...
Abstract

Automatic speaker recognition systems use the machines to recognize an individual via a spoken sentence. Those systems recognize a specific individual or confirm an individual’s claimed identity. The most common type of voice biometrics is the Speaker Recognition. Its task focused on validation of a person’s claimed identity, using features that have been obtained via their voices. Throughout the last decades a wide range of new advances in the speaker recognition area have been accomplished, but there are still many problems that need solving or require enhanced solutions. In this paper, a brief overview of speech processing is given firstly, then some feature extraction and classifier techniques are described, also a comparative and analysis of some previous research are studied in depth, all this work leads to determine the best methods for speaker recognition. Adaptive MFCC and Deep Learning methods are determined to be more efficient and accurate than other methods in speaker recognition, thus these methods are recommend to be more suitable for practical applications.


Article
A Wavelet Neural Network Ramwork for Speaker Idntifcation

Authors: Saleem M-R. Taha --- Dhiadeen M. Salih --- W.A. Mahmoud
Journal: Journal of Engineering مجلة الهندسة ISSN: 17264073 25203339 Year: 2006 Volume: 12 Issue: 1 Pages: 227-236
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

This paper introduces a new model-free identification methodology to detect and identify speakers and recognize them. The basic module of the methodology is a novel multi-dimensional wavelet neural network . The WNN approach include: a universal approximator ; the time – frequency localization : property of wavelets leads to reduced networks at a given level of performance ; The construct used as the feature mode classifier . Wavelet transform has been successfully applied to the processing of non – stationary speech signal and the feature vector that obtained becomes the input to the wavelet neural network which is trained off-line to map features to used for the classification procedure. An example is employed to illustrate the robustness and effectiveness of proposed scheme.

في هذا البحث تم اقتراح طريقة لنظام تمييز تعتمد على شبكة عصبية للتحويل المتموج ذات الابعاد (wavelet neural network) حيث ان نظرية (WN) يتضمن التحديد الزمني والترددي والتابع للتحويل التموجي مساعدا بتقليل نسبة تعقيد الشبكة وعلى الاساس استخدم هذه الشبكة كمصنف لخصائص لنماذج معينة من صوت كل متكلم حيث يستخلص بطريقة التحويل المتموج المتقطع (Discreet wavelet transform) لعدة مستويات بعد تقسيم كل صوت الى عدد من مقاطع متساوية ومن ثم اخذ الطاقة المعدلة لكل مستوى حيث يتحصل بذلك على متجه ذات معاملات تدل لخصائص الكلمة للمتكلم وبعده يطبق جميع المتجهات المستحصلة لكل متكلم على شبكة التحويل المتموج (WN) وذلك لغرض تعليم الشبكة (Learning face) ومن ثم تطبيق صوت متكلم مجهول على الشبكة للتعرف عليه وقد اعطىت هذه الطريقة عدد اوطىء من الحسابات وبذلك يزيد من كفاءة النظام ويقلل من وقت التنفيذ مقارنة لبقية الشبكات العصبية المستخدمة سابقا. هذه الطريقة تم تطبيقها على حاسبة سرعة معالجها (850 MHz Celeron) و(RAM 128 MB) ولغة برنامج هي MATLTAB 6 . اما قاعدة البيانات فهي مكونة من خمسة وعشرين شخص (12 ذكور و 13 اناث) وقد كانت نسبة التمييز هي 82% مع زمن تعلم للشبكة لايتجاوز 47 ثانية في حالة النص المستقل ونسبة 100% مع زمن تعلم للشبكة تصل الى 155 ثانية في حالة النص المتعمد

Listing 1 - 4 of 4
Sort by
Narrow your search

Resource type

article (4)


Language

English (4)


Year
From To Submit

2019 (1)

2011 (1)

2010 (1)

2006 (1)