research centers


Search results: Found 3

Listing 1 - 3 of 3
Sort by

Article
Data Hiding in Audio File by Modulating Amplitude
أخفاء البیانات في الملف الصوتي عن طریق تعدیل سعة العینات

Authors: Loay. A. Jorj --- Hilal H. Saleh --- Nidaa F.Hassan
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2010 Volume: 28 Issue: 5 Pages: 941-952
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

In this paper, two methods of a steganography are introduced for hidingsecret data in audio media file (.WAV). Hiding in audio becomes a challengingdiscipline, since the Human Auditory System is extremely sensitive. The firstproposed method is used to embed binary sequence with high data rate bymodulating the amplitude of WAVE file. The embedding process utilizes theamplitude modulation of the cover signal; the manipulation of the sample dependson its previous sample and next sample. By using this hiding method, good hidingrate is achieved, but it is noticed that the secret data produced by this method doesnot resist the modifications produced compression. The second suggested hidingmethods are oriented to embed the secret data such that it is capable of survivingagainst modifications produced by compression. This method exploits some of thefeatures of speech signal, more especially the features of the Voiced-Unvoicedblocks. The second proposed hiding method is used to embed secret data bymodulating the amplitude of the voiced blocks of cover audio data. Hiding rate isnot high as first method since it hiddes only in voiced segments ,so it could surviveagainst compression.

في هذا البحث جرى عرض اثنان من الطرائق الجديدة لأخفاء البيانات السرية في ملفاتأن الأخفاء في الصوت هو بالغ الدقة ,لأن النظام السمعي . (.Wav) صوتية ذات الأستطالةللأنسان جدا حساس. الطريقة المقترحة الأولى تم أخفاء البيانات السرية عن طريق تعديلويعتمد التعديل لأية عينة على العينتين السابقة و , (WAVE) سعة عينات الملف الصوتياللاحقة , وقد حققت هذة الطريقة نسبة جيدة من الاخفاء . لكن لوحظ بأن البيانات السريةالمخفية لاتستطيع الصمود امام التغيرات التي تحصل بواسطة الضغط. اما الطريقه الثانية فقدجرى تصميمها لأخفاء بيانات سرية لها القدرة على الصمود أمام التغيرات التي يمكن ان يتعرضله الصوت بواسطة الضغط . حيث تم أستغلال بعض خصائص أشارة الكلام ( بدقة اكثرالمقاطع الصوتية واللاصوتية) لغرض أخفاء نسب محددة من البيانات السرية. وفي الطريقةالثالثة تم أخفاء البيانات السرية بأستخدام تقنية تعديل سعة عينات المقاطع الصوتية للملفالصوتي (الغطاء) . وقد كان عدد البتات التي يمكن أخفائها ليس عاليا كما في الطريق الاولىلان الاخفاء يتم في المناطق الصوتيه فقط ليصبح لها القدره على الصمود امام الضغط.


Article
Spoken Word Recognition Using Slantlet Transform and Dynamic Time Warping
تمييز الكلمات بأستخدام تحويل المويل وطريقة ميلان الزمن الديناميكي

Author: Sadiq J. Abou-Loukh . صادق جاسم صادق جاسم أبو اللوخ
Journal: AL-NAHRAIN JOURNAL FOR ENGINEERING SCIENCES مجلة النهرين للعلوم الهندسية ISSN: 25219154 / eISSN 25219162 Year: 2011 Volume: 14 Issue: 1 Pages: 34-45
Publisher: Al-Nahrain University جامعة النهرين

Loading...
Loading...
Abstract

Speech recognition system has been widely used by many researchers using different methods to fulfill a fast and accurate system. Speech signal recognition is a typical classification problem, which generally includes two main parts: feature extraction and classification. In this work, three feature extraction methods, namely SLT, DWT Db1 and DWT Db4, were compared. The dynamic time warping (DTW) algorithm is used for recognition. Twenty three Arabic words were recorded fifteen different times in a studio by one speaker to form a database. The proposed system was evaluated using this database. The result shows recognition accuracy of 93.04%, 92.17% and 94.78% using DWT Db1, DWT Db4 and SLT respectively.

استعمل نظام تمييز الكلام بصورة واسعة بواسطة عدد من الباحثين بطرائق مختلفة لتحقيق طريقة تمييزسريعة ودقيقة. أن تمييز اشارة الكلام تعتبر مشكلة تصنيف نوعية وهي تضم بصورة عامة جزئين اساسيين: استخلاص الميزات و التصنيف. تضمن هذا العمل مقارنة بين ثلاثة طرق لاستخلاص الخصائص وهي تحويل المويجة (Db1and Db4) وتحويل المويل (SLT). استخدمت طريقة ميلان الزمن الديناميكي (DTW) للتمييز. ثلاثة وعشرون كلمة عربية بخمسة عشرازمان مختلفة مسجلة في الاستوديو بواسطة متكلم واحد لتشكل قاعدة بيانات . النظام المقترح وجد باستخدام قاعدة البيانات هذه. النتيجة بينت أن دقة التمييز هي (93.04%, 92.17% و 94.78%) باستخدام (Db1, Db4 and SLT) على التوالي.


Article
Mobile-Based Human Emotion Recognition Based on Speech and Heart Rate
تمييز المشاعر الانسانية باستخدام الهاتف الذكي عبر الانترنيت

Authors: Huda Majed هدى ماجد --- Hamid Mohammed Ali حامد محمد علي
Journal: Journal of Engineering مجلة الهندسة ISSN: 17264073 25203339 Year: 2019 Volume: 25 Issue: 11 Pages: 55-66
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Mobile-based human emotion recognition is a very challenging subject, most of the approaches suggested and built in this field utilized various contexts that can be derived from the external sensors and the smartphone, but these approaches suffer from different obstacles and challenges. The proposed system integrated human speech signal and heart rate, in one system, to leverage the accuracy of the human emotion recognition. The proposed system is designed to recognize four human emotions; angry, happy, sad, and normal. In this system, the smartphone is used to record user speech and send it to a server. The smartwatch, fixed on user's wrist, is used to measure user heart rate while the user is speaking and send it, via Bluetooth, to the smartphone, which in turn sends it to the server. At the server side, the speech features are extracted from the speech signal to be classified by a neural network. To minimize the misclassification of the neural network, the user heart rate measurement is used to direct the extracted speech features to either excited (angry and happy) neural network or to the calm (sad and normal) neural network. In spite of the challenges associated with the system, the system achieved 96.49% for known speakers and 79.05% for unknown speakers

يعتبر التعرف على المشاعر المرتكز على المحمول موضوعًا شديد الصعوبة ، وقد استخدمت معظم الأساليب المقترحة والمبنية في هذا المجال سياقات مختلفة يمكن استخلاصها من المستشعرات الخارجية والهاتف الذكي, ولكن هذه الأساليب تعاني من عقبات وتحديات مختلفة. النظام المقترح دمج إشارة الكلام البشري مع معدل ضربات القلب ، في نظام واحد ، للاستفادة من دقة تمييز المشاعر البشرية. تم تصميم النظام المقترح للتعرف على أربعة مشاعر إنسانية ؛ غاضب وسعيد وحزين وطبيعي. في هذا النظام ، يتم استخدام الهاتف الذكي لتسجيل خطاب المستخدم وإرساله إلى خادم. يتم استخدام ساعة ذكية ، مثبتة على معصم المستخدم ، لقياس معدل ضربات قلب المستخدم أثناء قيام المستخدم بالتحدث وإرساله ، عبر البلوتوث ، إلى الهاتف الذكي الذي بدوره يرسله إلى الخادم. على جانب الخادم ، يتم استخراج ميزات الكلام من إشارة الكلام لتصنيفها بواسطة الشبكة العصبية. لتقليل الخطأ في تصنيف الشبكة العصبية ، يتم استخدام قياس معدل ضربات القلب للمستخدم لتوجيه ميزات الكلام المستخرجة الى الشبكة العصبية إما الشبكة العصبية المتحمس (غاضب وسعيد) أو إلى الشبكة العصبية الهدوء (حزين والعادي). على الرغم من التحديات المرتبطة بالنظام ، فقد حقق النظام نسبة 96.49٪ للمتحدثين المعروفين و 79.05٪ للمتحدثين الغير معروفين .

Listing 1 - 3 of 3
Sort by
Narrow your search

Resource type

article (3)


Language

English (2)

Arabic and English (1)


Year
From To Submit

2019 (1)

2011 (1)

2010 (1)