Fulltext

Arabic Speech Recognition Using Two Techniques Hybrid & 3D-Multiwavelet

تمييز الكلام العربي باستخدام أسلوبين هجين ومتعدد المويجة ثلاثي الأبعاد

Talib M. Jawad Abbas

Al-Rafidain University College For Sciences مجلة كلية الرافدين الجامعة للعلوم
ISSN: 16816870 Year: 2008 Issue: 22 Pages: 116-131
Publisher: Rafidain University College كلية الرافدين الجامعة

Abstract

A key issue for implementing an accurate speech recognition system is the set of acoustic features extracted from speech signal. This paper presents two techniques for comparison. The first technique converts successfully the speech signal from (1-D) into two dimensional (2-D) forms. Next, the 2-D Multiwalidlet transform is applied to each 2-D signal. The second used transformation which is 3D-Multiwavelet (DMWT). For this transform set of speakers spoke the same word which arranged as slices of 2-D signals in acoustic space. These speakers represented the word as 3-D signal. The techniques apply the neural network as a classifier and dealing with text-dependent and text-independent speech recognition. The works are tested upon a database which consist of (28) speakers and uttered 7 Arabic words for each one. It was compared with first technique which gave the result (85.71%-100%), the second gave (71.43%-100%). It is clear that first give much better performance than the second one.

أن العنصر الأساسي في بناء وتنفيذ نظام تمييز كلام هي في اختيار المجموعة المناسبة لاستنباط الخواص. في هذا البحث تم اعتماد أسلوبين، الأسلوب الأول يعمل على تحويل مصفوفة أحادية الأبعاد الى مصفوفة ثنائية الأبعاد وتطبيق (Multiwalidlet) على كل أشارة ثنائية الأبعاد لغرض استنباط الخواص. الأسلوب الثاني استخدام محول متعدد المويجة ثلاثي الأبعاد(3D-Multiwavelet) ،ولهذا الغرض مجموعة من المتكلمين تنطق نفس الكلمة رتبت على شكل شرائح في مصفوفة ثلاثية. الأسلوبان طبق الشبكة العصبية كمصنف وتعامل مع تمييز الكلام ذو النص المعتمد والغير معتمد. تم فحص العمل على قاعدة بيانات تتكون من (28) متكلم نطقوا (7) كلمات عربية لكل منهم. كان معدل النسبية المئوية لدقة الأسلوب الأول هو (85.71%-100%) والثاني هو (71.43%-100%) و يظهر أن الأول كان الأكفأ من الثاني في تمييز الكلام.

Keywords

Arabic Speech Recognition --- تمييز الكلام العربي