research centers


Search results: Found 5

Listing 1 - 5 of 5
Sort by

Article
Speech Recognition Based Microcontroller for Wheelchair Movement
تمييز الكلام المستند على المتحكم الدقيق لحركات الكرسي المدولب

Authors: Mohammed E. Safi --- Eyad I. Abass
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2014 Volume: 32 Issue: 10 Part (A) Engineering Pages: 2340-2350
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

This paper introduced an approach to design and implement a control system for the movement of wheelchair by means of the human voice for paralyzed patients. In this paper, the Mel-Frequency Cepstral Coefficient (MFCC) technique is used as feature extraction with Dynamic Time Warping (DTW) for features matching. The output of the system is used to control the movement of the wheelchair through an interface between notebook and microcontroller.The experimental results showed that the proposed methods gave a recognition rate 100% of the already trained speakers with environment noise reach to 66dB. The test was conducted at different sound levels of the surrounding environment (53 to 73) dB as measured by Sound Level Meter (SLM).

هذا البحث يقدم طريقة للسيطرة على حركة الكرسي المدولب من خلال كلمات تم تمييزها للمتكلم وباستخدام المتحكم الدقيق. هذا البحث , التقنية المقترحة هي معاملات نغمة طيف التردد Mel-Frequency Cepstral Coefficient (MFCC) لأستخراج الخواص مع طريقة انحراف الوقت الديناميكي Dynamic Time Warping (DTW) لمطابقة الخصائص.اخيرا, استخدام الخارج من هذه الخورازمية للسيطرة على الكرسي المتحرك من خلال الربط بين الحاسوب والمتحكم الدقيق.تم اجراء الاختبار على مستويات مختلفة من ضوضاء البيئة المحيطة (53 الى 73) ديسيبل حسب قراءات جهاز قياس مستوى الصوت. وأظهرت النتائج التجريبية أن الأساليب المقترحة تعطي معدل التمييز بنسبة 100% للاصوات مسبقة التدريب لحدود ضوضاء تصل الى 66 ديسيبل.


Article
Spoken Word Recognition Using Slantlet Transform and Dynamic Time Warping
تمييز الكلمات بأستخدام تحويل المويل وطريقة ميلان الزمن الديناميكي

Author: Sadiq J. Abou-Loukh . صادق جاسم صادق جاسم أبو اللوخ
Journal: AL-NAHRAIN JOURNAL FOR ENGINEERING SCIENCES مجلة النهرين للعلوم الهندسية ISSN: 25219154 / eISSN 25219162 Year: 2011 Volume: 14 Issue: 1 Pages: 34-45
Publisher: Al-Nahrain University جامعة النهرين

Loading...
Loading...
Abstract

Speech recognition system has been widely used by many researchers using different methods to fulfill a fast and accurate system. Speech signal recognition is a typical classification problem, which generally includes two main parts: feature extraction and classification. In this work, three feature extraction methods, namely SLT, DWT Db1 and DWT Db4, were compared. The dynamic time warping (DTW) algorithm is used for recognition. Twenty three Arabic words were recorded fifteen different times in a studio by one speaker to form a database. The proposed system was evaluated using this database. The result shows recognition accuracy of 93.04%, 92.17% and 94.78% using DWT Db1, DWT Db4 and SLT respectively.

استعمل نظام تمييز الكلام بصورة واسعة بواسطة عدد من الباحثين بطرائق مختلفة لتحقيق طريقة تمييزسريعة ودقيقة. أن تمييز اشارة الكلام تعتبر مشكلة تصنيف نوعية وهي تضم بصورة عامة جزئين اساسيين: استخلاص الميزات و التصنيف. تضمن هذا العمل مقارنة بين ثلاثة طرق لاستخلاص الخصائص وهي تحويل المويجة (Db1and Db4) وتحويل المويل (SLT). استخدمت طريقة ميلان الزمن الديناميكي (DTW) للتمييز. ثلاثة وعشرون كلمة عربية بخمسة عشرازمان مختلفة مسجلة في الاستوديو بواسطة متكلم واحد لتشكل قاعدة بيانات . النظام المقترح وجد باستخدام قاعدة البيانات هذه. النتيجة بينت أن دقة التمييز هي (93.04%, 92.17% و 94.78%) باستخدام (Db1, Db4 and SLT) على التوالي.


Article
SPEECH RECOGNITION OF ARABIC WORDS USING ARTIFICIAL NEURAL NETWORKS
تمييز الكلمات العربية باستخدام الشبكة العصبية الاصطناعية

Author: Sadiq Jassim Abou-Loukh صادق جاسم ابو اللوخ
Journal: Journal of College of Education for Women مجلة كلية التربية للبنات ISSN: Print ISSN 16808738 /E ISSN: 2663547X Year: 2014 Volume: 25 Issue: 1 Pages: 196-206
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

The speech recognition system has been widely used by many researchers using different methods to fulfill a fast and accurate system. Speech signal recognition is a typical classification problem, which generally includes two main parts: feature extraction and classification. In this paper, a new approach to achieve speech recognition task is proposed by using transformation techniques for feature extraction methods; namely, slantlet transform (SLT), discrete wavelet transforms (DWT) type Daubechies Db1 and Db4. Furthermore, a modified artificial neural network (ANN) with dynamic time warping (DTW) algorithm is developed to train a speech recognition system to be used for classification and recognition purposes. Twenty three Arabic words were recorded fifteen different times in a studio by one speaker to form a database. The performance of the proposed system using this database has been evaluated by computer simulation using MATLAB package. The result shows recognition accuracy of 65%, 70% and 80% using DWT (Db1), DWT (Db4) and SLT respectively.

استعمل نظام تمييز الكلام بصورة واسعة بوساطة عدد من الباحثين باستخدام طرائق مختلفة لتحقيق نظام تمييز سريع ودقيق. ان تمييز اشارة الكلام تعد مشكلة تصنيف نوعية وهي تضم بصورة عامة جزئين اساسيين: استخلاص الميزات والتصنيف. تضمن هذا العمل اقتراح ثلاثة طرق لاستخلاص الخصائص وهي تحويل المويجي المتقطع ( (DWT بنوعيهDb4 and Db1 وتحويل المويل (SLT). تم تطوير نظام يعتمد على استخدام الشبكات العصبية الاصطناعية مع طريقة ميلان الزمن الديناميكي لغرض التمييز. ثلاثة وعشرون كلمة عربية بخمسة عشر ازمان مختلفة مسجلة في الاستوديو بوساطة متكلم واحد لتشكيل قاعدة بيانات. اداء النظام المقترح تم عن طريق تمثيل قاعدة البيانات باستخدام حقيبة الـ MATLAB . بينت النتائج ان دقة التمييز هي (65%، 70% و80%) باستخدام (DWT Db1, DWT Db4 and SLT) على التوالي.


Article
Isolated Word Speech Recognition Using Mixed Transform
تمييز الكلمات المفصولة باستخدام التحويلات الخليطة

Authors: Shahad Mujeeb Abdul-Razzaq شهد مجيب عبد الرزاق --- Sadiq Jassim Abou-Loukh صادق جاسم ابو اللوخ
Journal: Journal of Engineering مجلة الهندسة ISSN: 17264073 25203339 Year: 2013 Volume: 19 Issue: 10 Pages: 1271-1286
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Methods of speech recognition have been the subject of several studies over the past decade. Speech recognition has been one of the most exciting areas of the signal processing. Mixed transform is a useful tool for speech signal processing; it is developed for its abilities of improvement in feature extraction. Speech recognition includes three important stages, preprocessing, feature extraction, and classification. Recognition accuracy is so affected by the features extraction stage; therefore different models of mixed transform for feature extraction were proposed. The properties of the recorded isolated word will be 1-D, which achieve the conversion of each 1-D word into a 2-D form. The second step of the word recognizer requires, the application of 2-D FFT, Radon transform, the 1-D IFFT, and 1-D discrete wavelet transforms were used in the first proposed model, while discrete multicircularlet transform was used in the second proposed model. The final stage of the proposed models includes the use of the dynamic time warping algorithm for recognition tasks. The performance of the proposed systems was evaluated using forty different isolated Arabic words that are recorded fifteen times in a studio for speaker dependant. The result shows recognition accuracy of (91% and 89%) using discrete wavelet transform type Daubechies (Db1) and (Db4) respectively, and the accuracy score between (87%-93%) was achieved using discrete multicircularlet transform for 9 sub bands.

طرائق تمييز الكلام كان موضوع كثير من الدراسات خلال العقد الماضي. الكلام هو الطريقة الطبيعية للتواصل بين البشر ويعتبر تمييز الكلام واحد من المجالات المهمة في معالجة الإشارة. التحويلات الخليطة هي أداة مفيدة في معالجة إشارة الكلام، وقد تم تطويرها من اجل تحسين تمثيل الإشارة المستخلصة. يتضمن تمييز الكلام ثلاث أجزاء أساسية: معالجة مسبقة للإشارة، استخلاص الميزات، والتصنيف. تتاثر دقة تمييزالكلام بمرحلة استخلاص الميزات لذلك فقد تم اقتراح نماذج مختلفة من التحويلات الخليطة. ان خصائص الكلمات المسجلة ستكون احادية الابعاد (1-D) مما سيمكننا تحويلها الى صيغة ثنائية الابعاد (2-D). المرحلة الثانية في التصنيف تتطلب تطبيق التحويلات الخليطة، تحويل فورير ثنائي الابعاد يطبق على الإشارة ثنائية الأبعاد ثم تحويل رادون ثم تحويل فورير المعكوس احادي البعد. بعد ذلك تم استخدام تحويل المويجي المتقطع في النموذج الأول، بينما تم استخدام التحويل الدائري المتعدد في النموذج الثاني. المرحلة النهائية تتضمن استخدام تحويل الزمن الديناميكي لغرض التمييز بين الكلمات. أربعون كلمة عربية مسجلة بخمسة عشر زمن مختلف في الاستوديو بواسطة متكلم واحد استخدمت كقاعدة بيانات في هذا العمل. أداء كل الطرق المستخدمة تم تحليلها وتقييمها بواسطة الحاسوب باستخدام لغة MATLAB (2010a) .إن دقة تمييز الكلام في النموذج الأول تساوي (91% and 89%) عندما استعمل التحويل المويجي المتقطع نوع Db4 وDb1 على التوالي بينما كانت الدقة في النموذج الثاني بين 87%-93%)) عندما استخدمت تسعة أحزمة مختلفة من التحويل الدائري المتعدد.


Article
Speech Recognition using Wavelets and Improved SVM

Loading...
Loading...
Abstract

Speaker recognition (identification/verification) is the computing task of validating a user’s claimed identity using speaker specific information included in speech waves: that is, it enables access control of various services by voice. Discrete Wavelet Transform (DWT) based systems for speaker recognition have shown robust results for several years and are widely used in speaker recognition applications. This paper is based on text independent speaker recognition system that makes use of Discrete Wavelet Transform (DWT) as a feature extraction and kernel Support Vector Machine (SVM) approach as a classification tool for taking the decision through applying simplified-Class Support Vector Machine approach. The proposed SVM approach can convert local Euclidean distances between frame vectors to angles by projecting these d-dimensional vectors together, and get the minimum global distance from the non-linear aligned speech path in order to address audio classification, and hence, sound recognition.The DWT for each frame of the spoken word are taken as a tool for extracting the main feature as a data code vectors, next these data is normalized utilizing the normalized power algorithm that is used to reduce the number of feature vector coefficients then these data is scaled and tested with those stored of the training spoken words to achieve the speaker identification tasks, also the DWT gives fixed amount of data that can be utilized modesty by SVM. Finally, the proposed method is tested and trained upon a very large data base with results limited to ten speakers only (5 males and 5 females) with words of maximally 17 phenomena and its performance gives an accurate and stable results which rises the algorithm efficiency and reduce the execution time with 97% overall accuracy.

يعتبر تمييز المتكلم (تحديد الهوية والتحقق) من المهام الحسابية للتحقق من صحة المتكلم باستخدام معلومات موجات الكلام لنمكن الوصول للخدمات المختلفة بالصوت. تحويل المويجات المتقطعة (DWT) تم استعمالها لاستخلاص مويجات الصوت وقد اثبتت كفائتها لسنوات عدة على نطاق واسع في تطبيقات التعرف على المتكلم. في هذا العمل استعمل تحويل المويجات المتقطعة (DWT) مع نصوص الصوت المستقلة للمتكلم لاستخراج مميزات الصوت ثم استعمال ال ( SVM ) كمصنف, حيث تم تطبيق تصنيف سهل ( SVM ) لقياس المسافة بين متجهات الصوت وتحويلها لزوايا ليسهل استخراج الاصغر بينهم رغم تباين مقايس الاداء للصوت. يقوم ال (DWT) باستخراج ميزات كل الكلمة المنطوقة كمتجهات مصفوفة للبيانات ثم عمل تسوية normalize ) ) بالنسبة للقدرة لتقليل عدد معاملات البيانات التي ستدخل للمصنف SVM) ) كأداة لاتخاذ القرار من خلال عمل التدريب ومعرفة الكلمات المطلوبة , ومن سمات ال (DWT) هو استخراجه لكمية ثابتة من البيانات والتي يستفاد منها ال SVM) ) على اعتبار سهولة عمل المصنفات مع البيانات الثابتة. وأخيراً، تم اختبار الأسلوب المقترح بناء على قاعدة بيانات كبيرة جدا مع اخذ النتائج من عشرة متكلمين فقط (5 من الذكور و 5 من الإناث) مع كلمات أقصى حد لها 17 صوت للكلمة وترتفع كفاءة الخوارزمية ويقل وقت التنفيذ بنسبة .97%

Listing 1 - 5 of 5
Sort by
Narrow your search

Resource type

article (5)


Language

English (3)

Arabic and English (2)


Year
From To Submit

2014 (2)

2013 (2)

2011 (1)