زمان تخمینی مطالعه: 14 دقیقه

شناسایی تصویر وظیفه شناخت اشیاء مورد علاقه در یک تصویر و تشخیص اینکه تصویر متعلق به کدام دسته است را بر عهده دارد. در حالت کلی شناسایی تصویر(Image recognition)، شناسایی عکس(photo recognition) و شناسایی نگاره(picture recognition) اصطلاحاتی هستند که به جای یکدیگر استفاده می‌شوند. هنگامی که به صورت بصری یک شی یا صحنه را می‌بینیم، به طور خودکار اشیا را به عنوان نمونه‌های مختلف شناسایی می‌کنیم و آنها را با تعاریف فردی مرتبط می‌کنیم. با این حال، تشخیص بصری یک کار بسیار پیچیده برای ماشین‌ها است و به قدرت پردازش قابل توجهی نیاز دارد. کار شناسایی تصویر با هوش مصنوعی یک مشکل تحقیقاتی طولانی مدت در زمینه بینایی کامپیوتر است. در حالی که روش‌های مختلفی برای تقلید بینایی انسان تکامل یافته است، هدف مشترک شناسایی تصویر، طبقه‌بندی اشیاء شناسایی شده به دسته‌های مختلف است (تعیین دسته‌ای که یک تصویر به آن تعلق دارد).بنابراین به آن تشخیص شیء نیز می‌گویند.

در سال‌های گذشته، یادگیری ماشین، به‌ویژه فناوری یادگیری عمیق، در بسیاری از وظایف بینایی رایانه و درک تصویر به موفقیت‌های بزرگی دست یافته است. از این رو، روش‌های شناسایی تصاویر مبتنی بر یادگیری عمیق بهترین نتایج را از نظر عملکرد (فریم‌های محاسبه‌شده در ثانیه/FPS) و انعطاف‌پذیری به دست می‌آورند. سایت الکتروهایو در ادامه این نوشته، بهترین الگوریتم‌های یادگیری عمیق و مدل‌های هوش مصنوعی را برای شناخت تصویر پوشش خواهد داد.

شناسایی تصویر با استفاده از YOLO 7.

معنی و مفهوم شناسایی تصویر با هوش مصنوعی

در حوزه بینایی کامپیوتر، عباراتی مانند تقسیم‌بندی(Segmentation)، طبقه‌بندی(Classification)، شناسایی(Recognition) و تشخیص اشیا(Object Detection) اغلب به جای یکدیگر استفاده می‌شوند و وظایف مختلف با هم همپوشانی دارند. در حالی که این اغلب بدون مشکل است، اگر گردش کار شما به انجام یک کار خاص نیاز داشته باشد، همه چیز گیج کننده می‌شود.

– شناسایی تصویر در مقایسه با بینایی کامپیوتری

اصطلاحات شناسایی تصاویر و بینایی کامپیوتری اغلب به جای یکدیگر استفاده می‌شوند اما در واقع متفاوت هستند. در واقع، شناسایی تصویر یک کاربرد بینایی کامپیوتری است که اغلب به بیش از یک فرآیند بینایی کامپیوتری نیاز دارد، مانند شناسایی اشیا، شناخت تصویر و طبقه‌بندی تصویر.

تشخیص ماسک یکی از کاربردهای تشخیص تصویر.

شناسایی تصویر در مقابل محلی‌سازی شی(Object Localization)

محلی سازی اشیا زیر مجموعه دیگری از بینایی رایانه است که اغلب با شناسایی تصویر اشتباه گرفته می‌شود. محلی‌سازی شی به شناسایی محل یک یا چند شی در یک تصویر و ترسیم یک کادر محدود در اطراف محیط آنها اشاره دارد. با این حال، محلی‌سازی شی شامل طبقه‌بندی اشیاء شناسایی شده نمی‌شود.

تشخیص صورت در تصویر با استفاده از یادگیری عمیق

شناسایی تصویر در مقابل تشخیص تصویر(Image Detection)

اصطلاحات شناسایی تصاویر و تشخیص تصویر اغلب به جای یکدیگر استفاده می‌شوند. با این حال، تفاوت‌های فنی مهمی وجود دارد. تشخیص تصویر وظیفه گرفتن عکس به عنوان ورودی و یافتن اشیاء مختلف درون آن است. یک مثال تشخیص چهره است که هدف الگوریتم‌ها یافتن الگوهای چهره در تصاویر است (به تصویر بالا توجه کنید). وقتی به طور مستقیم با تشخیص سروکار داریم، اهمیتی نمی‌دهیم که آیا اشیاء شناسایی شده مهم هستند یا خیر. هدف تشخیص تصویر تنها تمایز یک شی از شی دیگر برای تعیین تعداد موجودیت‌های مجزا در تصویر است. بنابراین، جعبه‌های محدود کننده در اطراف هر شی جداگانه ترسیم می‌شوند. از سوی دیگر، شناخت تصویر وظیفه شناسایی اشیاء مورد علاقه در یک تصویر و تشخیص اینکه آنها به کدام دسته یا طبقه تعلق دارند است.

شناسایی تصویر با هوش مصنوعی چگونه کار می‌کند؟

فرآیند سیستم‌های شناسایی تصویر با هوش مصنوعی

مراحل اصلی در ستون فقرات سیستم‌های شناسایی تصویر شامل موارد زیر است :

شناسایی تصویر مبتنی بر هوش مصنوعی با یادگیری ماشینی

قبل از اینکه GPU ها (واحد پردازش گرافیکی) به اندازه کافی قدرتمند شوند تا از وظایف محاسباتی موازی شبکه‌های عصبی پشتیبانی کنند، الگوریتم‌های یادگیری ماشین سنتی استاندارد طلایی برای تشخیص تصویر بوده‌اند.

– مدل‌های یادگیری ماشینی شناسایی تصویر

در این بخش سه مدل معروف یادگیری ماشینی در شناسایی تصویر را بررسی می‌کنیم:

– مدل‌های شناسایی تصویر مبتنی بر یادگیری عمیق

در شناسایی تصاویر، استفاده از شبکه‌های عصبی کانولوشنال (CNN) را شناسایی تصاویر عمیق نیز می‌نامند. CNN ها با روش‌های سنتی یادگیری ماشینی ناسازگار هستند. CNN‌ها نه تنها سریع‌تر هستند و بهترین نتایج تشخیص را در شناسایی تصویر مبتنی بر یادگیری ماشین ارائه می‌دهند، بلکه می‌توانند چندین نمونه از یک شی را از داخل یک تصویر شناسایی کنند، حتی اگر تصویر کمی تاب خورده، کشیده یا به شکل دیگری تغییر کند.
در شناسایی عکس مبتنی بر یادگیری عمیق، شبکه‌های عصبی کانولوشنال حتی در کارهایی مانند طبقه‌بندی اشیا به دسته‌های ریزدانه(fine-grained) مانند نژاد خاص سگ یا گونه‌های پرنده از انسان‌ها بهتر عمل می‌کنند. محبوب‌ترین مدل‌های یادگیری عمیق، مانند YOLO، SSD، و RCNN از لایه‌های کانولوشن برای تجزیه یک تصویر یا عکس دیجیتال استفاده می‌کنند. در طول آموزش، هر لایه کانولوشن مانند یک فیلتر عمل می‌کند که یاد می‌گیرد برخی از جنبه‌های تصویر را قبل از اینکه به لایه بعدی منتقل شود، تشخیص دهد. یک لایه رنگ‌ها را پردازش می‌کند، لایه‌ای دیگر شکل‌ها و غیره. در پایان، یک نتیجه ترکیبی از همه این لایه‌ها در مجموع هنگام تعیین اینکه آیا مطابقت پیدا شده است یا نه در نظر گرفته می‌شود.

شناسایی تصویر دوچرخه سواران با استفاده از یادگیری عمیق.

الگوریتم‌های محبوب شناسایی تصویر مبتنی بر هوش مصنوعی

برای شناسایی تصویر یا شناسایی عکس، چند الگوریتم بالاتر از بقیه هستند. در حالی که همه اینها الگوریتم‌های یادگیری عمیق هستند، رویکرد اساسی آنها در مورد نحوه تشخیص کلاس‌های مختلف اشیاء متفاوت است. بیایید نگاهی به برخی از محبوب‌ترین مدل‌های شناسایی تصویر امروزی بیندازیم:

شناسایی تصویر مبتنی بر هوش مصنوعی برای چه مواردی استفاده می‌شود؟

در تمام صنایع، فناوری شناسایی تصاویر مبتنی بر هوش مصنوعی به طور فزاینده‌ای رو به رشد است. کاربردهای آن در صنایعی مانند مراقبت‌های بهداشتی، خرده فروشی، امنیت، کشاورزی و بسیاری دیگر ارزش اقتصادی ایجاد می‌کند.

2 پاسخ

    1. با سلام و عرض ادب خدمت شما بزرگوار. خوشحالم که مطلب مورد توجه شما بوده است.
      تیم پشتیبانی الکتروهایو

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *