TY - JOUR ID - TI - Fast Processing RNA-Seq on Multicore Processor المعالج متعدد النواة على RNA-SEQ السريعة المعالجة AU - Lee Jia Bin لى جيا بين AU - Nor Asilah Wati Abdul Hamid نور عسيلة واتي عبد حميد AU - Zurita Ismail زوريتا اسماعل AU - Mohamed Faris Laham محمد فاريس لاهم PY - 2021 VL - 18 IS - 4 Supplement SP - 1413 EP - 1422 JO - Baghdad Science Journal مجلة بغداد للعلوم SN - 20788665 24117986 AB - RNA Sequencing (RNA-Seq) is the sequencing and analysis of transcriptomes. The main purpose of RNA-Seq analysis is to find out the presence and quantity of RNA in an experimental sample under a specific condition. Essentially, RNA raw sequence data was massive. It can be as big as hundreds of Gigabytes (GB). This massive data always makes the processing time become longer and take several days. A multicore processor can speed up a program by separating the tasks and running the tasks’ errands concurrently. Hence, a multicore processor will be a suitable choice to overcome this problem. Therefore, this study aims to use an Intel multicore processor to improve the RNA-Seq speed and analyze RNA-Seq analysis's performance with a multiprocessor. This study only processed RNA-Seq from quality control analysis until sorted the BAM (Binary Alignment/Map) file content. Three different sizes of RNA paired end has been used to make the comparison. The final experiment results showed that the implementation of RNA-Seq on an Intel multicore processor could achieve a higher speedup. The total processing time of RNA-Seq with the largest size of RNA raw sequence data (66.3 Megabytes) decreased from 317.638 seconds to 211.916 seconds. The reduced processing time was 105 seconds and near to 2 minutes. Furthermore, for the smallest RNA raw sequence data size, the total processing time decreased from 212.380 seconds to 163.961 seconds which reduced 48 seconds.

هو تسلسل وتحليل الترنسكيبتوم RNA SEQUENCING (RNA-Seq)الغرض الرئيسي من التحليلات RNA-Seq هو معرفة وجود وكمية من RNA في عينة تجريبية تحت ظروف معينة. بشكل أساسي، كانت بيانات التسلسل RNA الخام ضخمة. يمكن أن يصل حجمه إلى مئات الجيجابايت (GB). تعمل هذه البيانات الضخمة دائما على جعل وقت المعالجة أطول ويستغرق عدة أيام. يمكن للمعالج متعدد النواة (multicore processor) تسريع البرنامج عن طريق فصل المهام وتشغيل مهام المهام بشكل متزامن. وبالتالي، سيكون المعالج متعدد النواة (multicore processor) خيارا مناسبا للتغلب على هذه المشكلة. لذلك، تهدف هذه الدراسة إلى استخدام Intel multicore processor لتحسين سرعة ًRNA-Seq وتحليل أداء تحليل RNA-Seq باستخدام معالجات متعددة (multiprocessor). عالجت هذه الدراسة RNA-Seq فقط من تحليل مراقبة الجودة حتى فرز محتوى ملف . BAM (Binary Allignment/Map) تم استخدام ثلاثة أحجام مختلفة من نهاية اقتران RNA لإجراء المقارنة. - أظهرت نتائج التجربة النهائية أن تنفيذ RNA-Seq على معالج Intel Multicore يمكن أن يحقق سرعة أعلى في العملية. انخفض إجمالي وقت المعالجة لبيانات تسلسل RNA الخام (66.3 ميغابايت) من 317.638 ثانية إلى 211.916 ثانية. كان وقت المعالجة المخفض 105 ثانية، أي ما يقرب من دقيقتين. وعلاوة عل ذلك، بالنسبة لأصغر حجم لبيانات تسلسل RNA الخام، انخفض إجمالي وقت المعالجة من 212.380 ثانية إلى 163.961 ثانية والذي تم تقليله بمقدار 48 ثانية. ER -