زمان تخمینی مطالعه: 9 دقیقه
یادگیری عمیق در چند سال اخیر تأثیر شگرفی بر حوزههای مختلف فناوری داشته است. یکی از داغترین موضوعاتی که در این صنعت مطرح است، بینایی رایانه است، توانایی رایانهها برای درک تصاویر و ویدیوها، ماشینهای خودران، بیومتریک و تشخیص چهره همگی برای کار به بینایی کامپیوتری متکی هستند. هسته بینایی کامپیوتر پردازش تصویر است.
تصویر چیست؟
قبل از اینکه به پردازش تصویر بپردازیم، ابتدا باید بفهمیم که دقیقاً یک تصویر از چه چیزی تشکیل شده است. یک تصویر دیجیتال با ابعاد آن (ارتفاع و عرض) بر اساس تعداد پیکسلها نشان داده میشود. به عنوان مثال، اگر ابعاد یک تصویر 500 در 400 (عرض x ارتفاع) باشد، تعداد کل پیکسلهای تصویر 200000 است. هر پیکسل نقطهای از تصویر است که میتواند سایه، تیرگی یا رنگ خاصی به خود بگیرد و معمولاً در یکی از حالات زیر نشان داده میشود:
- مقیاس خاکستری : پیکسل یک عدد صحیح با مقدار بین 0 تا 255 است (0 کاملا سیاه و 255 کاملا سفید است).
- RGB : یک پیکسل از 3 عدد صحیح بین 0 تا 255 تشکیل شده است (اعداد صحیح نشان دهنده شدت رنگ قرمز، سبز و آبی هستند).
- RGBA: پسوند RGB با یک فیلد آلفا اضافه شده است که نشان دهنده کدورت(Opacity) تصویر است.
پردازش تصویر به دنبالههای ثابتی از عملیات نیاز دارد که در هر پیکسل از یک تصویر انجام میشود. پردازشگر تصویر اولین دنباله عملیات را بر روی تصویر پیکسل به پیکسل انجام میدهد. هنگامی که این کار به طور کامل انجام شد، شروع به انجام عملیات دوم و غیره میکند. مقدار خروجی این عملیات را میتوان در هر پیکسل از تصویر محاسبه کرد.
پردازش تصویر چیست؟
پردازش تصویر فرآیند تبدیل یک تصویر به شکل دیجیتال و انجام عملیات خاصی برای به دست آوردن اطلاعات مفید از آن تصویر است. سیستم پردازش تصویر معمولاً هنگام استفاده از روشهای پردازش سیگنال از پیش تعیینشده، همه تصاویر را به عنوان سیگنالهای دوبعدی در نظر میگیرد.
انواع عملیات پردازش تصویر
پنج عملیات اصلی در پردازش تصویر وجود دارد که عبارتند از:
- تجسم Visualization: یافتن اشیایی که در تصویر قابل مشاهده نیستند
- تشخیص Recognition: مشخص کردن یا تشخیص اشیاء در تصویر
- تیز کردن و بازیابی Sharpening and restoration: یک تصویر پیشرفته با جزئیات از تصویر اصلی ایجاد کنید
- تشخیص الگو Pattern recognition: الگوهای مختلف اطراف اشیاء در تصویر را اندازهگیری کرده و مشخص میکند
- بازیابی Retrieval: مرور و جستجوی تصاویر از یک پایگاه داده بزرگ از تصاویر دیجیتال که مشابه تصویر اصلی است
اجزای اصلی پردازش تصویر
- کامپیوتر: یک رایانه همه منظوره، که ممکن است هر چیزی از رایانه شخصی گرفته تا یک ابر رایانه باشد، در یک سیستم پردازش تصویر استفاده میشود. گاهی اوقات، کامپیوترهای ساخته شده خاص در برنامههای کاربردی تخصصی برای رسیدن به درجه مشخصی از عملکرد مورد استفاده قرار میگیرند.
- سخت افزار برای پردازش تخصصی تصویر: این شامل دیجیتایزر و سخت افزاری است که میتواند عملیات اساسی را انجام دهد، از جمله یک واحد منطق محاسباتی(ALU)، که میتواند عملیات حسابی و منطقی همزمان را روی تصاویر کامل انجام دهد.
- ذخیرهسازی عظیم: در برنامههایی که شامل پردازش تصویر هستند، مهارتی ضروری است. سه نوع اصلی ذخیرهسازی دیجیتال برای برنامههای پردازش تصویر به شرح زیر است: (1) ذخیرهسازی کوتاه مدت، (2) ذخیرهسازی آنلاین برای فراخوانی سریع (3) ذخیرهسازی آرشیو، که با دسترسی نادر مشخص میشود.
- سنسور دوربین: این مفهوم اشاره به ادراک دارد. وظیفه اصلی سنسور تصویر جمع آوری نور ورودی، تبدیل آن به سیگنال الکتریکی، اندازهگیری آن سیگنال و سپس تبدیل آن به خروجی الکترونیکی است. این موضع شامل یک آرایه دو بعدی از اجزای حساس به نور است که فوتونها را به الکترون تبدیل میکند. تصاویر توسط تجهیزاتی مانند دوربینهای دیجیتال با استفاده از حسگرهای تصویر مانند CCD و CMOS گرفته میشود. برای جمع آوری و ذخیره تصاویر دیجیتال اغلب به دو جزء در حسگرهای تصویر نیاز است. اولی یک ابزار واقعی (حسگر) است که میتواند انرژی ساطع شده از جسمی را که میخواهیم به تصویر تبدیل کنیم، تشخیص دهد. دومی دیجیتایزر است که خروجی دستگاه حسگر فیزیکی را به شکل دیجیتال تبدیل میکند.
- نمایش تصویر: این فرآیند در واقع نمایش تصاویر ذخیره شده است.
- نرم افزار: نرم افزار پردازش تصویر شامل ماژولهای تخصصی است که عملکردهای خاصی را انجام میدهند.
- تجهیزات چاپ: چاپگرهای لیزری، دوربینهای فیلم، تجهیزات حساس به حرارت، چاپگرهای جوهرافشان و تجهیزات دیجیتال مانند دیسکهای نوری و CDROM تنها چند نمونه از ابزارهای مورد استفاده برای ضبط تصاویر هستند.
- شبکهسازی: برای ارسال دادههای بصری از طریق یک کامپیوتر شبکه، یک جزء ضروری است. مهمترین عامل در انتقال تصویر پهنای باند است زیرا برنامههای کاربردی پردازش تصویر به مقادیر زیادی داده نیاز دارند.
مراحل اساسی پردازش تصویر
- تهیه تصویر Image Acquisition: گرفتن تصویر اولین گام در پردازش تصویر است. این مرحله به عنوان پیش پردازش در پردازش تصویر نیز شناخته میشود. این مرحله شامل بازیابی تصویر از یک منبع، معمولا یک منبع مبتنی بر سخت افزار است.
- افزایش کیفیت عکس Image Enhancement: بهبود تصویر فرآیند بیرون آوردن و برجسته کردن برخی از ویژگیهای مورد علاقه در تصویری است که تار شده است. این میتواند شامل تغییر روشنایی، کنتراست و غیره باشد.
- بازیابی تصویر Image Restoration: بازیابی تصویر فرآیند بهبود ظاهر یک تصویر است. با این حال، بر خلاف بهبود تصویر، بازیابی تصویر با استفاده از مدلهای ریاضی یا احتمالی خاصی انجام میشود.
- پردازش تصویر رنگی: پردازش تصویر رنگی شامل تعدادی از تکنیکهای مدلسازی رنگ در یک حوزه دیجیتال است. این مرحله به دلیل استفاده قابل توجه از تصاویر دیجیتال در اینترنت، اهمیت پیدا کرده است.
- موجکها و پردازش چند وضوحی Wavelets and Multiresolution Processing: از موجکها برای نمایش تصاویر در درجات مختلف وضوح استفاده میشود. تصاویر به موجکها یا مناطق کوچکتر برای فشردهسازی دادهها و نمایش هرمی تقسیم میشوند.
- فشردهسازی Compression: فشردهسازی فرآیندی است که برای کاهش فضای ذخیرهسازی مورد نیاز برای ذخیره یک تصویر یا پهنای باند مورد نیاز برای انتقال آن استفاده میشود. این کار به ویژه زمانی انجام میشود که تصویر برای استفاده در اینترنت باشد.
- پردازش مورفولوژیکی Morphological Processing: پردازش مورفولوژیکی مجموعهای از عملیات پردازش برای شکلدهی تصاویر بر اساس شکل آنها است.
- تقسیمبندی Segmentation: بخشبندی یکی از دشوارترین مراحل پردازش تصویر است. این مرحله شامل تقسیم یک تصویر به اجزا یا اشیاء تشکیل دهنده آن است.
- نمایش و تشرح Representation and Description: پس از اینکه یک تصویر در فرآیند تقسیمبندی به مناطق تقسیم شد، هر منطقه به شکلی مناسب برای پردازش کامپیوتری بیشتر نشان داده و توصیف میشود. بازنمایی با ویژگیهای تصویر و ویژگیهای منطقهای سروکار دارد. توضیحات به استخراج اطلاعات کمی میپردازد که به تمایز یک کلاس از اشیا از دسته دیگر کمک میکند.
- شناسایی Recognition: شناسایی بر اساس توضیحات یک شی، برچسبی را به آن اختصاص میدهد.
کاربردهای پردازش تصویر
- بازیابی تصاویر پزشکی: پردازش تصویر به طور گستردهای در تحقیقات پزشکی مورد استفاده قرار گرفته است و برنامههای درمانی کارآمدتر و دقیقتری را ممکن کرده است. به عنوان مثال، میتوان از آن برای تشخیص زودهنگام سرطان سینه با استفاده از یک الگوریتم پیچیده تشخیص گره در اسکن سینه استفاده کرد. از آنجایی که استفاده پزشکی مستلزم پردازشگرهای تصویر بسیار آموزش دیده است، این برنامهها قبل از اینکه برای استفاده پذیرفته شوند، نیاز به پیادهسازی و ارزیابی قابل توجهی دارند.
- فناوریهای سنجش ترافیک: در مورد سنسورهای ترافیک، از سیستم پردازش تصویر ویدیویی یا VIPS استفاده میشود. این سیستم شامل الف) یک سیستم تصویربرداری ب) یک سیستم مخابراتی و ج) یک سیستم پردازش تصویر است. هنگام ضبط ویدئو، یک VIPS دارای چندین منطقه تشخیص است که هر زمان که وسیله نقلیه وارد آن مناطق میشود سیگنال روشن و سپس هر زمان که وسیله نقلیه از منطقه تشخیص خارج میشود سیگنال خاموش صادر میشود. این مناطق تشخیص را میتوان برای خطوط متعدد تنظیم کرد و میتوان از آنها برای احساس ترافیک در یک ایستگاه خاص استفاده کرد. علاوه بر این، میتوان به طور خودکار پلاک خودرو را ثبت کند، نوع وسیله نقلیه را تشخیص دهد، سرعت راننده را در بزرگراه ثبت کند و موارد دیگر.
- بازسازی تصویر Image Reconstruction: از پردازش تصویر میتوان برای بازیابی و ترمیم قسمتهای گم شده یا خراب یک تصویر استفاده کرد. این شامل استفاده از سیستمهای پردازش تصویر است که به طور گسترده با مجموعه دادههای عکس موجود برای ایجاد نسخههای جدیدتر از عکسهای قدیمی و آسیب دیده آموزش دیدهاند.
- شناسایی چهره: یکی از رایجترین کاربردهای پردازش تصویر که امروزه از آن استفاده میکنیم، تشخیص چهره است. این مفهوم از الگوریتمهای یادگیری عمیق پیروی میکند که در آن ماشین ابتدا با ویژگیهای خاص صورت انسان مانند شکل صورت، فاصله بین چشمها و غیره آموزش داده میشود. پس از آموزش ویژگیهای صورت انسان به ماشین، شروع به پذیرش تصاویر حاوی صورت انسان میکند. تشخیص چهره ابزاری حیاتی است که در امنیت، بیومتریک و حتی فیلترهای موجود در اکثر برنامههای رسانههای اجتماعی این روزها استفاده میشود.
مزایای پردازش تصویر
پیادهسازی تکنیکهای پردازش تصویر تاثیر زیادی بر بسیاری از سازمانهای مبتنی بر فناوری داشته است. در اینجا برخی از مفیدترین مزایای پردازش تصویر، صرف نظر از زمینه عملیات، آورده شده است:
- تصویر دیجیتال را میتوان در هر فرمت دلخواه (تصویر بهبود یافته، X-Ray، عکس نگاتیو و غیره) در دسترس قرار داد.
- این به بهبود تصاویر برای تفسیر انسان کمک میکند
- اطلاعات را میتوان برای تفسیر ماشینی پردازش و از تصاویر استخراج کرد
- پیکسلهای تصویر را میتوان به هر چگالی و کنتراست دلخواه دستکاری کرد
- تصاویر را میتوان به راحتی ذخیره و بازیابی کرد
- این امکان را برای انتقال الکترونیکی آسان تصاویر به ارائه دهندگان شخص ثالث فراهم میکند