TY - JOUR ID - TI - Embedded Descriptor Generation in Faster R-CNN for Multi-Object Tracking أنشاء واصف متضمن داخل معمارية Faster R-CNN من اجل تتبع كائنات متعددة AU - Younis A. Younis يونس عباس يونس AU - Khalil I. Alsaif خليل ابراهيم السيف PY - 2021 VL - 15 IS - 2 SP - 91 EP - 102 JO - AL-Rafidain Journal of Computer Sciences and Mathematics مجلة الرافدين لعلوم الحاسوب والرياضيات SN - 48161815 23117990 AB - With the rapid growth of computer usage to extract the required knowledge from a huge amount of information, such as a video file, significant attention has been brought towards multi-object detection and tracking. Artificial Neural Networks (ANNs) have shown outstanding performance in multi-object detection, especially the Faster R-CNN network. In this study, a new method is proposed for multi-object tracking based on descriptors generated by a neural network that is embedded in the Faster R-CNN. This embedding allows the proposed method to directly output a descriptor for each object detected by the Faster R-CNN, based on the features detected by the Faster R-CNN to detect the object. The use of these features allows the proposed method to output accurate values rapidly, as these features are already computed for the detection and have been able to provide outstanding performance in the detection stage. The descriptors that are collected from the proposed method are then clustered into a number of clusters equal to the number of objects detected in the first frame of the video. Then, for further frames, the number of clusters is increased until the distance between the centroid of the newly created cluster and the nearest centroid is less than the average distance among the centroids. Newly added clusters are considered for new objects, whereas older ones are kept in case the object reappears in the video. The proposed method is evaluated using the UA-DETRAC (University at Albany Detection and Tracking) dataset and has been able to achieve 64.8% MOTA and 83.6% MOTP, with a processing speed of 127.3 frames per second.

مع النمو السريع لاستخدام الكمبيوتر لاستخراج المعرفة المطلوبة من كمية هائلة من المعلومات ، مثل ملف الفيديو، تم توجيه اهتمام كبير نحو الكشف عن العناصر المتعددة وتعقبها. أظهرت الشبكات العصبية الاصطناعية (ANNs) أداءً متميزًا في اكتشاف الكائنات المتعددة، وخاصة شبكة R-CNN المتسارعة. في هذه الدراسة، تم اقتراح طريقة جديدة لتتبع الكائنات المتعددة بناءً على الواصفات التي تم إنشاؤها بواسطة شبكة عصبية متضمنه في Faster R-CNN. يسمح هذا التضمين للطريقة المقترحة بإخراج واصف مباشرة لكل كائن تم اكتشافه بواسطة Faster R-CNN، بناءً على الخصائص التي تم اكتشافها بواسطة Faster R-CNN لاكتشاف الكائن. يسمح استخدام هذه الخصائص للطريقة المقترحة بإخراج قيم دقيقة بسرعة حيث تم حساب هذه الخصائص بالفعل للكشف وتمكنت من تقديم أداء متميز في مرحلة الاكتشاف ثم يتم تجميع الواصفات التي تم جمعها من الطريقة المقترحة في عدد من المجموعات يساوي عدد العناصر المكتشفة في الإطار الأول من الفيديو ثم بالنسبة للإطارات الإضافية، يتم زيادة عدد المجموعات حتى تصبح المسافة بين المركز للعنقود الناشئ حديثاً واقرب مركز منه اقل من متوسط المسافة المجموعات المضافة حديثاً تمثل كائنات جديدة مكتشفة بينما يتم الاحتفاظ بالكائنات القديمة في حاله ظهور الكائن مرة اخرى في الفيديو.يتم تقييم الطريقة المقترحة باستخدام مجموعة بيانات UA-DETRAC (University at Albany Detection and Tracking) وتمكنت من تحقيق 64.8٪ MOTA و83.6٪ MOTP، مع سرعة معالجة 127.3 إطارًا في الثانية. ER -