زمان تخمینی مطالعه: 8 دقیقه

محلی‌سازی شی و تصویر یکی از مهمترین وظایف در بینایی کامپیوتری (CV) است. در Object Localization، الگوریتم یک شی را در یک تصویر شناسایی و محلی‌سازی می‌کند. از طرف دیگر، محلی‌سازی تصویر سعی می‌کند تمام اشیاء را در یک تصویر مشخص محلی‌سازی کند. کاربردهای مختلفی از محلی‌سازی شی وجود دارد. شناسایی افراد (نظارت)، شناسه وسیله نقلیه (کنترل ترافیک)، تصویربرداری پیشرفته پزشکی، وسایل نقلیه خودمختار، و تجزیه و تحلیل ورزشی – همه از محلی‌سازی اشیاء استفاده می‌کنند. با این حال، چالش‌هایی در محلی‌سازی شی و تصویر وجود دارد – ظاهر شیء مختلف، درهم‌رفتگی پس‌زمینه، تغییرات مقیاس/چشم‌انداز، انسداد و غیره.

محلی‌سازی شی Object Localization چیست؟

محلی‌سازی اشیاء یک وظیفه مهم در بینایی کامپیوتر است. این تکنیک اشیاء خاص را در تصاویر یا ویدیوهای دیجیتال شناسایی و به درستی محلی‌سازی می‌کند. هدف اصلی محلی‌سازی شی، تعیین دقیق موقعیت اشیاء مورد نظر در یک تصویر و نمایش آن با یک جعبه محاط است. اولین مرحله در محلی‌سازی شی، تشخیص اشیاء است. محققان از یک مدل یادگیری عمیق برای شناسایی اشیاء بالقوه در یک تصویر استفاده می‌کنند. این تکنیک در مرحله تشخیص از شبکه‌های پیشنهادی منطقه برای شناسایی و علامت‌گذاری مناطقی که احتمالاً حاوی اشیاء هستند استفاده می‌کند. پس از تشخیص شی، محلی‌سازی دقیق مناطق شناسایی شده را اصلاح می‌کند. سپس جعبه‌های محدود کننده‌ای را رسم می‌کند که حاوی اشیاء شناسایی شده می‌باشد. همچنین، تکنیک‌های پیشرفته‌ای مانند تقسیم‌بندی نمونه، مرزهای اشیاء را در سطح پیکسل مشخص می‌کنند.

برای کسب ویژگی‌های متمایز از اشیاء محلی، محققان از تکنیک‌های استخراج ویژگی استفاده می‌کنند. ویژگی‌هایی که شناسایی قوی و قابل اعتماد را ارائه می‌دهند شامل بافت، شکل، رنگ یا سایر ویژگی‌های متمایز می‌باشد. برای تولید پیش‌بینی‌های صحیح برای جعبه‌های محاط، محققان مراحل پس پردازش متنوعی مانند اصلاح جعبه مرزی را اعمال می‌کنند. این کار باعث می‌شود که پیش‌بینی‌های اضافی یا همپوشانی‌ها حذف شوند. الگوریتم‌های OL مکان‌یابی دقیق و درک زمینه اشیاء را در محیط‌های بصری پیچیده امکان‌پذیر می‌کنند. برای ارزیابی عملکرد مدل‌های محلی‌سازی شی، از مقیاس‌های کمی استفاده می‌شود، به عنوان مثال. معیارهای ارزیابی مانند دقت میانگین متوسط(MAP).

اجزای محلی‌سازی شی

اجزای محلی‌سازی شامل چندین مرحله اصلی است که هر کدام به شناسایی پایدار و دقیق شی کمک می‌کنند.

بخش‌بندی نمونه با تکنیک خوشه‌بندی.

مدل‌ها و الگوریتم‌های محلی‌سازی شی

برای شناسایی و مکان‌یابی دقیق اشیاء درون تصاویر، الگوریتم‌های محلی‌سازی از تکنیک‌های مختلف ریاضی استفاده می‌کنند. لیست کامل این الگوریتم‌ها شامل موارد زیر است:

محلی‌سازی شکل توسط جبر ماتریسی.
مفهوم شبکه‌های عصبی کانولوشن (CNN)

چالش‌های عملی محلی‌سازی شی

محلی‌سازی اشیاء در بینایی کامپیوتر یک کار پیچیده است. چندین چالش بر دقت و کارایی فرآیند محلی‌سازی می‌تواند اثر گذار باشد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *