زمان تخمینی مطالعه: 10 دقیقه

یکی از مهم ترین عملیات در بینایی کامپیوتر، بخش‌بندی تصویر یا Image Segmentation است. قطعه‌بندی تصویر فرآیند تقسیم یک تصویر به چندین قسمت یا ناحیه است که به یک کلاس تعلق دارند. این وظیفه خوشه‌بندی بر اساس معیارهای خاصی انجام می‌گردد و می‌تواند به عنوان مثال بر اساس رنگ یا بافت باشد. به این فرآیند طبقه‌بندی در سطح پیکسل نیز می‌گویند. به عبارت دیگر این فرآیند شامل پارتیشن‌بندی تصاویر (یا فریم‌های ویدیویی) به بخش‌ها یا اشیاء متعدد است.

بخش‌بندی تصاویر معنایی تصاویر پهپادهای هوایی. صحنه با هر پیکسل متعلق به یک کلاس خاص، مانند “ساختمان”، “جاده”، “درخت” جدا می‌شود.

در 40 سال گذشته، روش‌های تقسیم‌بندی مختلفی پیشنهاد شده‌اند، از تقسیم‌بندی تصویر متلب و روش‌های سنتی بینایی رایانه‌ای تا روش‌های پیشرفته یادگیری عمیق. به خصوص با ظهور شبکه‌های عصبی عمیق (DNN)، کاربردهای بخش‌بندی تصویر پیشرفت فوق العاده‌ای داشته‌اند.

قطعه‌بندی تصویر در رانندگی خودمختار.

تکنیک‌های بخش‌بندی تصویر

تکنیک‌های Image Segmentation مختلفی وجود دارد و هر تکنیک مزایا و معایب خاص خود را دارد که در ادامه به آنها خواهیم پرداخت.

کاربردهای بخش‌بندی تصویر

مشکلات Image Segmentation در طیف وسیعی از برنامه‌های بینایی رایانه‌ای در دنیای واقعی، از جمله تشخیص علائم جاده، زیست‌شناسی، ارزیابی مصالح ساختمانی، یا امنیت و نظارت تصویری، نقش اصلی را ایفا می‌کنند. همچنین، خودروهای خودران و سیستم‌های کمک راننده پیشرفته (ADAS) باید سطوح قابل رانندگی را شناسایی کرده یا تشخیص عابر پیاده را اعمال کنند.

نمونه مجموعه داده KITTI برای بخش‌بندی تصویر

علاوه بر این، بخش‌بندی تصویر به طور گسترده در برنامه‌های تصویربرداری پزشکی، مانند استخراج مرز تومور یا اندازه‌گیری حجم بافت به کار گرفته می‌شوند. در اینجا، فرصتی برای طراحی پایگاه‌های داده تصویر استاندارد شده بوجود آمد که می‌تواند برای ارزیابی بیماری‌ها و بیماری‌های همه‌گیر جدید (به عنوان مثال، برای کاربردهای بینایی هوش مصنوعی در کنترل ویروس کرونا) استفاده شود.

بخش‌بندی تصویر مبتنی بر یادگیری عمیق با موفقیت در قطعه‌بندی تصاویر ماهواره‌ای در زمینه سنجش از دور، از جمله تکنیک‌های برنامه‌ریزی شهری یا کشاورزی دقیق، به کار گرفته شده است. همچنین، تصاویر جمع‌آوری‌شده توسط پهپادها با استفاده از تکنیک‌های مبتنی بر یادگیری عمیق تقسیم‌بندی شده‌اند و فرصتی را برای رسیدگی به مشکلات مهم زیست‌ محیطی مرتبط با تغییرات آب و هوایی ارائه می‌دهند.

الگوریتم YOLOv7-mask به عنوان مثال بخش‌بندی.توجه کنید که YOLOv7 یکی از بهترین الگوریتم‌های بلادرنگ در این حوزه است.

بخش‌بندی معنایی در مقابل بخش‌بندی نمونه

قطعه‌بندی تصویر را می‌توان به عنوان یک مسئله طبقه‌بندی پیکسل‌ها با برچسب‌های معنایی (بخش‌بندی معنایی) یا پارتیشن‌بندی اشیاء مجزا (بخش‌بندی نمونه) فرمول‌بندی کرد. بخش‌بندی معنایی برچسب‌گذاری کلاس در سطح پیکسل را با مجموعه‌ای از دسته‌بندی اشیاء (به عنوان مثال، مردم، درختان، آسمان، اتومبیل‌ها) برای همه پیکسل‌های تصویر انجام می‌دهد. معمولاً این کار دشوارتر از طبقه‌بندی تصویر است که یک برچسب واحد را برای کل تصویر یا فریم پیش بینی می‌کند. بخش‌بندی نمونه، دامنه تقسیم‌بندی معنایی را با شناسایی و ترسیم تمام اشیاء مورد علاقه در یک تصویر، بیشتر می‌کند.

بخش‌بندی تصویر با نمونه‌های مختلف از یک کلاس (ساختمان‌های فردی، خانه‌ها)

بخش‌بندی تصویر و یادگیری عمیق

چندین نمونه مختلف الگوریتم Image Segmentation توسعه داده شده است. روش‌های قبلی عبارتند از آستانه‌گذاری، بسته‌بندی مبتنی بر هیستوگرام، رشد منطقه، خوشه‌بندی k-means یا بخش بندی حوزه‌. با این حال، الگوریتم‌های پیشرفته‌تر مبتنی بر خطوط فعال، برش‌های نمودار، میدان‌های تصادفی شرطی و مارکوف و روش‌های مبتنی بر پراکندگی هستند. در چند سال گذشته، مدل‌های یادگیری عمیق بخش جدیدی از مدل‌های قطعه‌بندی تصویر را با بهبود عملکرد قابل‌توجهی معرفی کرده‌اند. مدل‌های بخش‌بندی تصویر مبتنی بر یادگیری عمیق اغلب بهترین نرخ‌های دقت را در معیارهای رایج به دست می‌آورند که منجر به تغییر پارادایم در زمینه می‌شود.

مجموعه داده ADE20K برای بخش‌بندی تصویر

محبوب‌ترین مجموعه داده‌های بخش‌بندی تصویر

با توجه به موفقیت مدل‌های یادگیری عمیق در طیف وسیعی از کاربردهای بینایی، تحقیقات زیادی با هدف توسعه رویکردهای قطعه‌بندی تصویر با استفاده از یادگیری عمیق انجام شده است. در حال حاضر، مجموعه داده‌های کلی زیادی در رابطه با قطعه‌بندی تصویر وجود دارد. محبوب‌ترین مجموعه داده‌های بخش‌بندی تصویر عبارتند از:

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *