research centers


Search results: Found 12

Listing 1 - 10 of 12 << page
of 2
>>
Sort by

Article
Speaker Recognition System Using Celluar Automata
نظام تمييز المتكلم بإستخدام الماكينة الخلوية

Authors: Aladdin J. Abdulwahid --- Ahmed A. Al-Attab --- Moaid A. Fadhil
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2005 Volume: 24 Issue: 8 Pages: 961-984
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract


Article
Arabic Speech Recognition Using Two Techniques Hybrid & 3D-Multiwavelet
تمييز الكلام العربي باستخدام أسلوبين هجين ومتعدد المويجة ثلاثي الأبعاد

Author: Talib M. Jawad Abbas
Journal: Al-Rafidain University College For Sciences مجلة كلية الرافدين الجامعة للعلوم ISSN: 16816870 Year: 2008 Issue: 22 Pages: 116-131
Publisher: Rafidain University College كلية الرافدين الجامعة

Loading...
Loading...
Abstract

A key issue for implementing an accurate speech recognition system is the set of acoustic features extracted from speech signal. This paper presents two techniques for comparison. The first technique converts successfully the speech signal from (1-D) into two dimensional (2-D) forms. Next, the 2-D Multiwalidlet transform is applied to each 2-D signal. The second used transformation which is 3D-Multiwavelet (DMWT). For this transform set of speakers spoke the same word which arranged as slices of 2-D signals in acoustic space. These speakers represented the word as 3-D signal. The techniques apply the neural network as a classifier and dealing with text-dependent and text-independent speech recognition. The works are tested upon a database which consist of (28) speakers and uttered 7 Arabic words for each one. It was compared with first technique which gave the result (85.71%-100%), the second gave (71.43%-100%). It is clear that first give much better performance than the second one.

أن العنصر الأساسي في بناء وتنفيذ نظام تمييز كلام هي في اختيار المجموعة المناسبة لاستنباط الخواص. في هذا البحث تم اعتماد أسلوبين، الأسلوب الأول يعمل على تحويل مصفوفة أحادية الأبعاد الى مصفوفة ثنائية الأبعاد وتطبيق (Multiwalidlet) على كل أشارة ثنائية الأبعاد لغرض استنباط الخواص. الأسلوب الثاني استخدام محول متعدد المويجة ثلاثي الأبعاد(3D-Multiwavelet) ،ولهذا الغرض مجموعة من المتكلمين تنطق نفس الكلمة رتبت على شكل شرائح في مصفوفة ثلاثية. الأسلوبان طبق الشبكة العصبية كمصنف وتعامل مع تمييز الكلام ذو النص المعتمد والغير معتمد. تم فحص العمل على قاعدة بيانات تتكون من (28) متكلم نطقوا (7) كلمات عربية لكل منهم. كان معدل النسبية المئوية لدقة الأسلوب الأول هو (85.71%-100%) والثاني هو (71.43%-100%) و يظهر أن الأول كان الأكفأ من الثاني في تمييز الكلام.


Article
Speech Recognition Approach From Midi File
اسلوب تمييز الاصـوات مـــن ملـــف المـــيديا

Author: Khadhim Mahdi Almusawi
Journal: Univesity of Thi-Qar Journal مجلة جامعة ذي قار العلمية ISSN: 66291818 Year: 2012 Volume: 7 Issue: 3 Pages: 1-14
Publisher: Thi-Qar University جامعة ذي قار

Loading...
Loading...
Abstract

In this paper we explore a new technique for speech recognition from recorded human speech on midi file .The microphone is used to record the statement in the computer .The speech features are extracted from input track using a proposed algorithm corresponding to the melody to be used in the recognition algorithm. The aim is to build a reliable and efficient large scale system that collect thousands of sound as a Midi data, finally the system will returns list of the wave files most similar to the humming and recognize the input sound. In this paper we record one statement in available language of 200 different person from our city (alnassiryha in south of Iraq) and store as a system data base. Promising result were obtained testing different Midi files as experiments.

في هذا البحث نعرض تقنية جديدة لتمييز كلام الانسان المسجل على ملف الميديا .تم استخدام المايكرفون لتسجيل جملة محددة على الحاسبة وتم استخلاص الملامح من المقاطع الداخلة باستخدام الخوارزمية المقترحة لغرض استخدامها في خوارزمية التمييز .ان الهدف هو بناء نظام واسع وكفوء الذي يجمع عدد كبير من الاصوات ويخزن على ملف من نوع ميديا ويعطينا قائمة من ملفات الاشخاص المشابهة للصوت الداخل لغرض تمييزه .في هذا البحث سجلنا عبارة واحدة باللغة المحلية ل 200 شخص في مدينة (الناصرية –جنوب العراق )وتم خزنها لتكون قاعدة بيانات النظام .ثم التحقق من صحة النتائج باستخدام تجارب مختلفة .الكلمات المفتاحية :.- تمييز الاصوات – ملامح الصوت نغمات الصوت – ملف الميديا


Article
Speech Recognition Based Microcontroller for Wheelchair Movement
تمييز الكلام المستند على المتحكم الدقيق لحركات الكرسي المدولب

Authors: Mohammed E. Safi --- Eyad I. Abass
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2014 Volume: 32 Issue: 10 Part (A) Engineering Pages: 2340-2350
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

This paper introduced an approach to design and implement a control system for the movement of wheelchair by means of the human voice for paralyzed patients. In this paper, the Mel-Frequency Cepstral Coefficient (MFCC) technique is used as feature extraction with Dynamic Time Warping (DTW) for features matching. The output of the system is used to control the movement of the wheelchair through an interface between notebook and microcontroller.The experimental results showed that the proposed methods gave a recognition rate 100% of the already trained speakers with environment noise reach to 66dB. The test was conducted at different sound levels of the surrounding environment (53 to 73) dB as measured by Sound Level Meter (SLM).

هذا البحث يقدم طريقة للسيطرة على حركة الكرسي المدولب من خلال كلمات تم تمييزها للمتكلم وباستخدام المتحكم الدقيق. هذا البحث , التقنية المقترحة هي معاملات نغمة طيف التردد Mel-Frequency Cepstral Coefficient (MFCC) لأستخراج الخواص مع طريقة انحراف الوقت الديناميكي Dynamic Time Warping (DTW) لمطابقة الخصائص.اخيرا, استخدام الخارج من هذه الخورازمية للسيطرة على الكرسي المتحرك من خلال الربط بين الحاسوب والمتحكم الدقيق.تم اجراء الاختبار على مستويات مختلفة من ضوضاء البيئة المحيطة (53 الى 73) ديسيبل حسب قراءات جهاز قياس مستوى الصوت. وأظهرت النتائج التجريبية أن الأساليب المقترحة تعطي معدل التمييز بنسبة 100% للاصوات مسبقة التدريب لحدود ضوضاء تصل الى 66 ديسيبل.


Article
HIERARCHICAL ARABIC PHONEME RECOGNITION USING MFCC ANALYSIS
التمييز المهيكل للاصوات العربية بأستخدام الشبكات العصبية

Loading...
Loading...
Abstract

In this paper, a hierarchical Arabic phoneme recognition system is proposed in which Mel FrequencyCepstrum Coefficients (MFCC) features is used to train the hierarchical neural networks architecture.Here, separate neural networks (subnetworks) are to be recursively trained to recognize subsets ofphonemes. The overall recognition process is a combination of the outputs of these subnetworks.Experiments that explore the performance of the proposed hierarchical system in comparison to nonhierarchical(flat) baseline systems are also presented in this paper.

Mel ) لتمييز الاصوات العربية حيث تم استخدام معاملات ( hierarchical) في هذا البحث تم اقتراح نظام مهيكللتدریب مجموعة من الشبكات العصبية المهيكلة من خلال تدریب آل شبكة (Frequency Cepstrum Coefficientsعلى حدة وبصورة تكراریة لجعلها قادرة على تمييز مجاميع محددة من الاصوات العربية. (subnetwork) عصبية مفردةالنتيجة النهائية لعملية التمييز یمكن استنتاجها من خلال اخراجات هذه الشبكات العصبية. وقد اظهرت التجارب التي اجریتان استعمال الترآيب المهيكل یزید دقة تمييز (flat) لاختبار اداء النظام المهيكل المقترح بالمقارنة مع النظام غير المهيكلالاصوات العربية.


Article
Using group of statistical operator toward Optimal segmentation of Arabic word signal to its basic phonemes
اعتماد مجموعة عوامل إحصائية لتقطيع أمثل لصوت الكلمة العربية إلى فونيماته الأساسية

Author: Esra’a Jassim Harfash أسراء جاسم حرفش
Journal: Journal of Basrah Researches (Sciences) مجلة ابحاث البصرة ( العلميات) ISSN: 18172695 Year: 2008 Volume: 34 Issue: 4B Pages: 30-38
Publisher: Basrah University جامعة البصرة

Loading...
Loading...
Abstract

In this research, we are segment the sound Arabic signal to its basic group of phonemes depending on three statistical operators that are( mean ,standard deviation ,covariance) to reduce the error in determining the correct points segment . Each operator is implemented on the data of the sound entered word and then the results are manipulated by some processes that give intermediate results , these results (from each implementing of operator) merges together and give union results that are passed to postprocessing in order to prepare to find the points segment in high efficient.

في هذا البحث قمنا بتقطيع صوت الكلمة العربية إلى مجموعة فونيماته الأساسية التي يتألف منها بالاعتماد على ثلاثة عوامل إحصائية مختلفة هي ( المعدل ، الانحراف المعياري ، والتباين) وذلك لأجل تقليل الخطأ في تحديد نقطة القطع الصحيحة إلى اقل مايمكن . كل عامل من هذه العوامل يتم تطبيقه (على حده) على بيانات صوت الكلمة المدخلة وان نتائج التطبيق هذه تمر بعد ذلك بمجموعة من المعالجات تعطينا نتائج وسطية ، وان النتائج الوسطية المستخرجة من تطبيق كل عامل على البيانات تدمج مع بعضها (لأجل تقليل الخطأ كما ذكرنا في أعلاه) وبذلك تتكون لدينا نتائج موحدة تمر بدورها بمرحلة معالجة لاحقة تكون عندها جاهزة لاستخراج نقاط القطع منها بكفاءة عالية .


Article
FPGA Implementation Of Multilayer Perceptron For Speech Recognition
تنفيذ شبكة المدرك متعددة الطبقات على شريحة FPGA لأغراض تمييز الكلام

Author: Ghassan Hazin Shakoory غسان حازم شكوري
Journal: Journal of Engineering and Sustainable Development مجلة الهندسة والتنمية المستدامة ISSN: 25200917 Year: 2013 Volume: 17 Issue: 6 Pages: 175-185
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Loading...
Loading...
Abstract

In this paper, a method for designing and implementing of Multilayer Percepton (MLP) based on BP algorithm has been suggested. The method has described a MLP on Register Transfer Level (RTL) using VHDL description language and implemented on Field Programmable Gate Array (FPGA) for speech recognition. Firstly, a multiply-accumulate (MAC) unit, and sigmoid nonlinear function are implemented as a basic building units of the MLP. The MLP is trained by BP learning algorithm. The optimized parameters are obtained by Matlab simulation for off chip training design. The implementations have been developed and tested on Xilinx Spartan-IIIE XC3S500E FPGA chip for embedded systems using Xilinx ISE 10.1 software. The research also presents a summary of the performance cost and data throughput with regards to the speed and required computational resources. The proposed hardware architecture are found to be 6 times faster than the software implementation.

في هذا البحث، تم اقتراح طريقة لتصميم وتنفيذ شبكة المدرك متعددة الطبقات (MLP) والمبنية على خوارزمية الانتشار العكسي للخطأ(BP) . تم وصف شبكة MLP في هذه الطريقة بمستوى تصميم المسجلات (RTL) باستخدام لغة وصف الكيان المادي (VHDL)، وتم التنفيذ على شريحة مصفوفة البوابات المبرمجة حقليا (FPGA) لأغراض تمييز الكلام. صممت وحدة الضرب والتجميع (MAC) أولا ,ثم دالة التفعيل الغير خطية نوع سكمويد كوحدات أساسية لتنفيذ البنية المادية الكاملة لشبكة MLP. أستخدم برنامج محاكاة في البيئة البرمجية Matlab لإيجاد القيم المثلى لشبكة MLP باستخدام خوارزمية BP. أن الهدف من هذا البحث هو تطوير واختبار التنفيذ على كيان التشكيل المطاوع لشريحة نوع Xilinx Spartan-IIIE XC3S500E FPGA ولأغراض التطبيق في الأجهزة المضمنة باستخدام برنامج Xilinx ISE 10.1 . قدم هذا البحث أيضا ملخص الايداء وعامل العطاء نسبة للسرعة ومصادر الشريحة المستخدمة. حيث وجدت معمارية الكيان المادي المقترحة أسرع 6 مرات مقارنة مع الكيان البرمجي.


Article
The Segmentation of Arabic word signal based on Eigenvalues and Eigenvectors principles

Loading...
Loading...
Abstract

In this paper, we use the principles of eigenvalues and eigenvectors for the first time in the field of Arabic word segmentation. In the beginning, the segmentation algorithm calculates eigenvalues and eigenvectors for each input speech signal, and selects the largest values. The values of final vector are used for linear separation to consonant regions and vowel regions by using threshold value which calculated from the final vector itself. The segmentation points are extracted efficiently and determine the beginning and the end points of each phoneme of the input word signal in high accuracy. Experimental results for a number of isolated Arabic words for a number of speakers ( males and females) given in the paper show that the algorithm determines the beginning and the end points for each phoneme in the input speech signals efficiently.

في هذا البحث أستخدمنا مبادئ القيم والمتجهات الذاتية لاول مرة في مجال تقطيع صوت الكلمة العربية . في البدء تحسب خوارزمية التقطيع القيم الذاتية والمتجهات الذاتية لكل أشارة كلام داخلة ، ثم تنتقى القيم الاكبر. أن قيم المتجه النهائي الناتج تستعمل لاجل الفصل الخطي الى مناطق صوت ساكنة ومناطق صوت معتلة بأستعمال قيمة عتبة محسوبة من المتجه النهائي نفسه ،أن نقاط القطع تستخرج هنا بشكل كفوء، ومن خلالها تحدد نقاط البداية والنهاية لكل فونيم من أشارة الكلمة الداخلة وبدقة عالية. أن النتائج التجريبية لعدد من الكلمات العربية المعزولة ولعدد من المتكلمين (ذكور واناث) أظهرت أن هذه الخوارزمية لها القدرة على تحديد نقاط البدء والنهاية لكل فونيم في أشارة الكلام الداخل بكفاءة عالية جداً.


Article
SPEECH RECOGNITION OF ARABIC WORDS USING ARTIFICIAL NEURAL NETWORKS
تمييز الكلمات العربية باستخدام الشبكة العصبية الاصطناعية

Author: Sadiq Jassim Abou-Loukh صادق جاسم ابو اللوخ
Journal: Journal of College of Education for Women مجلة كلية التربية للبنات ISSN: Print ISSN 16808738 /E ISSN: 2663547X Year: 2014 Volume: 25 Issue: 1 Pages: 196-206
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

The speech recognition system has been widely used by many researchers using different methods to fulfill a fast and accurate system. Speech signal recognition is a typical classification problem, which generally includes two main parts: feature extraction and classification. In this paper, a new approach to achieve speech recognition task is proposed by using transformation techniques for feature extraction methods; namely, slantlet transform (SLT), discrete wavelet transforms (DWT) type Daubechies Db1 and Db4. Furthermore, a modified artificial neural network (ANN) with dynamic time warping (DTW) algorithm is developed to train a speech recognition system to be used for classification and recognition purposes. Twenty three Arabic words were recorded fifteen different times in a studio by one speaker to form a database. The performance of the proposed system using this database has been evaluated by computer simulation using MATLAB package. The result shows recognition accuracy of 65%, 70% and 80% using DWT (Db1), DWT (Db4) and SLT respectively.

استعمل نظام تمييز الكلام بصورة واسعة بوساطة عدد من الباحثين باستخدام طرائق مختلفة لتحقيق نظام تمييز سريع ودقيق. ان تمييز اشارة الكلام تعد مشكلة تصنيف نوعية وهي تضم بصورة عامة جزئين اساسيين: استخلاص الميزات والتصنيف. تضمن هذا العمل اقتراح ثلاثة طرق لاستخلاص الخصائص وهي تحويل المويجي المتقطع ( (DWT بنوعيهDb4 and Db1 وتحويل المويل (SLT). تم تطوير نظام يعتمد على استخدام الشبكات العصبية الاصطناعية مع طريقة ميلان الزمن الديناميكي لغرض التمييز. ثلاثة وعشرون كلمة عربية بخمسة عشر ازمان مختلفة مسجلة في الاستوديو بوساطة متكلم واحد لتشكيل قاعدة بيانات. اداء النظام المقترح تم عن طريق تمثيل قاعدة البيانات باستخدام حقيبة الـ MATLAB . بينت النتائج ان دقة التمييز هي (65%، 70% و80%) باستخدام (DWT Db1, DWT Db4 and SLT) على التوالي.


Article
DESIGN, MODELING, AND IMPLEMENTATION OF PIC BASED ELECTRICAL WHEELCHAIR
تصميم، نمذجة و تنفيذ كرسي كهربائي متحرك بالاعتماد على ال PIC

Author: Mohannad Abid Shehab Ahmed مهند عبد شهاب احمد
Journal: DIYALA JOURNAL OF ENGINEERING SCIENCES مجلة ديالى للعلوم الهندسية ISSN: 19998716/26166909 Year: 2014 Volume: 7 Issue: 4 Pages: 62-81
Publisher: Diyala University جامعة ديالى

Loading...
Loading...
Abstract

Nowadays, voice is one of the methods commonly used to control the electrical and electronic appliances because of easily being reproduced by human.Many people with disabilities do not have the dexterity necessary to control a joystick on an electrical wheelchair, so the aim of this study is to control access to voice services and to implement a wheelchair using small vocabulary word recognition system.The HM2007 IC serves as the ear that will listen and interpret the voice command, while the PIC18F458 serve as the brain of the system that will process and coordinate the correct output of the input command to control the wheelchair motors. The methodology adopted is speech recognition development for isolated word from independent speakers where any speaker has two different sentences first for training and the second for testing to release the operation. The input of the system is a set of pick up five words used to control the movements of two motors connected to PIC 18F458 which is used as a programmable and controllable device, the speed of the motors is adjusted using the PWM (Pulse Width Modulation) technique where the duty cycle is simultaneously varied according to input switching device.For more efficient design, the system can worked in worst condition that could be achieved in noisy environment with different signal to noise ratios, besides that the electric power supply can utilize the solar cells.Finally, the proposed system is implemented and tested upon a data base consists of ten speakers (6 males and 4 females) and its performance rises the algorithm efficiency and reduce the execution time with 97% noiseless overall accuracy.

في الوقت الحاضر، يعتبر الصوت احد الطرق المستخدمة للسيطرة على الأجهزة الكهربائية والإلكترونية بسبب سهولة توليده من قبل الإنسان. كثير من المعاقين ليس لديهم المهارة اللازمة للسيطرة على عصا التحكم في الكرسي الكهربائي المتحرك. الهدف من هذه الدراسة هو تنفيذ كرسي متحرك باستخدام نظام التحكم في الخدمات الصوتية والسيطرة على المحركات في الكرسي المتحرك. يعتبر ال IC HM2007 بمثابة الأذن التي تستمع وتفسر الأمر الصوتي في حين أن PIC 18F458 بمثابة الدماغ الذي يقوم بمعالجة وتنسيق أوامر الإدخال وتنفيذ الإخراج الصحيح. الطريقة المستخدمة في تمييز الكلمات هي للكلمات المفردة المستقلة الصغيرة التي تعتمد على الكلام ولا تعتمد على المتكلم حيث نحتاج لجملتين الأولى للتدريب والثانية للاختبار.مدخلات النظام عبارة عن مجموعة من خمس كلمات تستخدم للسيطرة على اثنين من المحركات المربوطة لل PIC 18F458 الذي يستخدم كجهاز للبرمجة والتحكم، يتم ضبط سرعة المحركات باستخدام تقنية PWM (نبض تعديل العرض) حيث تتنوع دورة العمل للوقت حسب السرعة المطلوبة.لزيادة كفاءة المنظومة تم تصميم واختبار المنظومة بنجاح في بيئة مختلفة ونسب قوة إشارة متغيرة إلى نسب الضوضاء, اضافة لاستخدام الخلايا الشمسية كمجهز قدرة .وأخيراً، تم اختبار دوائر النظام المقترح بناءا" على قاعدة بيانات من عشرة متكلمين فقط (6 من الذكور و 4 من الإناث) مع خمس كلمات لترتفع كفاءة الخوارزمية ويقل وقت التنفيذ بنسبة 97% في بيئة خالية من الضوضاء.الكلمة الدليلية : HM2007، الخلايا الشمسية، دائرة دارلينكتون، PIC 18F458، كرسي متحرك ، تمييز الكلام، برمجة مايكرو C.

Listing 1 - 10 of 12 << page
of 2
>>
Sort by
Narrow your search

Resource type

article (12)


Language

English (9)

Arabic and English (2)

Arabic (1)


Year
From To Submit

2019 (1)

2014 (3)

2013 (2)

2012 (1)

2010 (1)

More...