زمان تخمینی مطالعه: 11 دقیقه

ردیابی اشیاء وظیفه شناسایی خودکار اشیاء در یک ویدیو و تفسیر آنها به عنوان مجموعه‌ای از مسیرها با دقت بالا است. الگوریتم‌های ردیابی اشیاء(Object Tracking) پس از تشخیص اشیاء در صحنه، شناسه‌ای منحصر به فرد به هر شی تخصیص داده و سپس اشیاء شناسایی شده را در فریم‌های یک ویدیو ردیابی می‌کند. اغلب، نشانه‌ای در اطراف شی مورد ردیابی وجود دارد، به عنوان مثال، یک مربع محاط که شی را دنبال می‌کند و به کاربر نشان می‌دهد که شی در صفحه در کجا قرار دارد.

کاربردها و انواع ردیابی اشیاء

ردیابی اشیاء برای موارد مختلف استفاده می‌شود که شامل انواع مختلف فیلم ورودی است. اینکه ورودی پیش‌بینی‌شده یک تصویر یا ویدیو باشد یا نه، یا یک ویدیوی بلادرنگ در مقابل یک ویدیوی از پیش ضبط‌شده، بر الگوریتم‌های مورد استفاده برای ایجاد برنامه‌ها تأثیر می‌گذارد. نوع ورودی همچنین بر دسته، موارد استفاده و برنامه‌ها تأثیر می‌گذارد. در اینجا، ما به طور مختصر چند کاربرد و انواع رایج ردیابی اشیاء، مانند ردیابی ویدئو، ردیابی بصری و ردیابی تصویر را شرح خواهیم داد.

اصلی‌‌ترین چالش‌های ردیابی اشیاء

چالش‌های اصلی معمولاً از مشکلات موجود در تصویر ناشی می‌شوند که تشخیص موثر روی تصاویر را برای مدل‌ها دشوار می‌کند. در اینجا، ما در مورد چند مورد از رایج‌ترین مسائل مربوط به ردیابی اشیاء و روش‌های پیشگیری یا مقابله با این چالش‌ها بحث خواهیم کرد.

تفریق پس‌زمینه (با OpenCV) از پردازش تصویر برای مدیریت حواس‌پرتی‌های بصری استفاده می‌کند
مفهوم چارچوب‌های اجرای هرم ویژگی.
مثالی از انسداد در تشخیص و ردیابی شی: فرد تا حدی در پشت جعبه‌ها پنهان شده است.

سطوح ردیابی اشیاء

Object Tracking از چندین زیرگروه تشکیل شده است زیرا کاربرد وسیعی دارد و سطوح ردیابی شی بسته به تعداد اشیایی که ردیابی می‌شوند متفاوت است.

الگوریتم‌های محبوب ردیابی اشیاء

شبکه‌های عصبی کانولوشنال (CNN) پر استفاده‌ترین و قابل اعتمادترین شبکه برای ردیابی اشیاء باقی مانده است. با این حال، چندین معماری و الگوریتم نیز در حال بررسی هستند. از جمله این الگوریتم‌ها می‌توان به شبکه‌های عصبی بازگشتی (RNN)، رمزگذارهای خودکار (AEs)، شبکه‌های متخاصم مولد (GAN)، شبکه‌های عصبی سیامی (SNN) و شبکه‌های عصبی سفارشی اشاره کرد. اگرچه شناسایی اشیاء را می‌توان برای ردیابی اشیاء در صورت اعمال فریم به فریم استفاده کرد، اما این یک محدودیت محاسباتی است. در عوض، تشخیص شی باید یک بار اعمال شود، و سپس ردیاب شی می‌تواند هر فریم را بعد از اولی کنترل کند. این یک فرآیند محاسباتی موثرتر و کمتر دست و پا گیرتر برای انجام ردیابی شی است.

– ردیابی اشیاء بوسیله OpenCV

ردیابی شی OpenCV یک روش محبوب است. این به این دلیل است که OpenCV الگوریتم‌های زیادی دارد که به طور خاص برای نیازها و اهداف ردیابی اشیاء یا حرکت بهینه شده‌اند. ردیاب‌های شی OpenCV خاص شامل ردیاب‌های BOOSTING، MIL، KCF، CSRT، MedianFlow، TLD، MOSSE و GOTURN می‌شوند. هر یک از این ردیابها برای اهداف مختلف بهترین هستند. به عنوان مثال، CSRT زمانی بهترین است که کاربر به دقت ردیابی شی بالاتر نیاز داشته باشد و بتواند سرعت FPS کندتر را تحمل کند. انتخاب یک الگوریتم ردیابی شی OpenCV به مزایا و معایب آن ردیاب خاص و مزایا بستگی دارد:

تحلیل مسیرهای طی شده توسط مشتری‌ها در فروشگاه با الگوریتم ردیابی اشیاء.

– DeepSORT

الگوریتم DeepSORT یک انتخاب خوب برای ردیابی اشیاء است و یکی از پرکاربردترین چارچوب‌های Object Tracking است. اطلاعات ظاهری در الگوریتم ادغام شده است که عملکرد DeepSORT را بسیار بهبود می‌بخشد. به دلیل ادغام، اشیاء در طول دوره‌های طولانی انسداد قابل ردیابی هستند – که تعداد سوئیچ‌های هویت را کاهش می‌دهد.

– ردیابی اشیاء با متلب

MATLAB یک پلت فرم محاسباتی عددی است از این رو در اجرا در مقایسه با DeepSORT و OpenCV متفاوت است، اما با این وجود انتخاب خوبی برای کارهای ردیابی بصری است. جعبه ابزار Computer Vision در MATLAB الگوریتم‌های ردیابی ویدیویی مانند تغییر میانگین تطبیقی پیوسته (CAMShift) و Kanade-Lucas-Tomasi (KLT) را برای ردیابی یک شی یا برای استفاده به عنوان بلوک‌های ساختمانی در یک سیستم ردیابی پیچیده‌تر ارائه می‌دهد.

MDNet

MDNet یک الگوریتم ردیابی بصری سریع و دقیق مبتنی بر CNN است که از شبکه تشخیص اشیاء R-CNN الهام گرفته شده است. این تکنیک با نمونه‌برداری از مناطق کاندید و عبور آنها از طریق CNN عمل می‌کند. سی‌ان‌ان معمولاً روی یک مجموعه داده وسیع از قبل آموزش داده شده و در اولین فریم در یک ویدیوی ورودی اصلاح می‌شود. بنابراین، MDNet برای موارد استفاده ردیابی شی بلادرنگ بسیار مفید است. با این حال، در حالی که از پیچیدگی محاسباتی بالایی از نظر سرعت و فضا رنج می‌برد، همچنان گزینه دقیقی است. جنبه‌های محاسباتی سنگین MDNet را می‌توان با انجام ادغام RoI (منطقه مورد علاقه) به حداقل رساند. این یک راه نسبتا موثر برای اجتناب از مشاهدات تکراری و تسریع استنتاج است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *