با بینایی کامپیوتر سه بعدی 3D Computer Vision آشنا شوید!!!

بینایی کامپیوتر سه بعدی شاخهای از علوم کامپیوتر است که بر روی ثبت، پردازش تصویر و تجزیه و تحلیل دادههای بصری سه بعدی تمرکز دارد. هدف این مفهوم بازسازی و درک ساختار سه بعدی اشیاء و صحنهها از تصاویر دو بعدی یا دادههای ویدیویی است. تکنیکهای بینایی سهبعدی از اطلاعات منابعی مانند دوربینها یا حسگرها […]
ردیابی اشیاء Object Tracking در بینایی کامپیوتر
ردیابی اشیاء وظیفه شناسایی خودکار اشیاء در یک ویدیو و تفسیر آنها به عنوان مجموعهای از مسیرها با دقت بالا است. الگوریتمهای ردیابی اشیاء(Object Tracking) پس از تشخیص اشیاء در صحنه، شناسهای منحصر به فرد به هر شی تخصیص داده و سپس اشیاء شناسایی شده را در فریمهای یک ویدیو ردیابی میکند. اغلب، نشانهای در […]
ثبت تصویر Image Registration و کاربردهای آن

در بسیاری از برنامههای بینایی کامپیوتری (مانند ردیابی اشیاء و تصویربرداری پزشکی) نیاز به تراز کردن دو یا چند تصویر از یک شی (یا صحنه) از دیدگاهها با زاویههای مختلف، در زمانهای مختلف یا در شرایط مختلف وجود دارد. الگوریتمهای ثبت تصویر(Image Registration) در عمل یک تصویر داده شده (تصویر مرجع) را به تصویر دیگری […]
تشخیص خودکار شماره پلاک یا سیستم ANPR

فن آوری تشخیص خودکار شماره پلاک یا ANPR در سالهای اخیر به دلیل طیف گستردهای از مزایای آن برای کاربردهای مختلف محبوبیت زیادی پیدا کرده است. مدیریت ترافیک، پارکینگ هوشمند، اتوماسیون عوارض، سیستمهای حمل و نقل هوشمند در شهرهای هوشمند و تجزیه و تحلیل زمان سفر تنها تعدادی از مزایایی است که ANPR ارائه میدهد. […]
تقویت داده تصویر Image Data Augmentation برای بینایی کامپیوتر

ظهور بینایی کامپیوتر تا حد زیادی مبتنی بر موفقیت روشهای یادگیری عمیق است که از شبکههای عصبی کانولوشنال (CNN) استفاده میکنند. با این حال، این شبکههای عصبی به شدت به دادههای آموزشی زیادی برای جلوگیری از برازش بیش از حد و عملکرد ضعیف مدل وابسته هستند. متأسفانه، در بسیاری از موارد مانند برنامههای کاربردی در […]
همه چیز درباره دیتاست COCO مایکروسافت

COCO یک مجموعه داده بصری است که نقش مهمی در بینایی رایانه ایفا میکند. در این مقاله، همه چیزهایی را که باید در مورد مجموعه داده محبوب COCO مایکروسافت بدانید که به طور گسترده برای پروژههای یادگیری ماشینی استفاده میشود، پوشش خواهیم داد. در این نوشته یاد میگیریم که با دیتاست COCO چه کاری میتوانیم […]
معرفی DeepFace محبوبترین کتابخانه تشخیص چهره منبع باز

تشخیص چهره برای چندین دهه موضوعی داغ در حوزه پردازش تصویر و هوش مصنوعی بوده است. در این حوزه کتابخانههای زیادی معرفی شده است ولی DeepFace بسیار محبوب شده است و در برنامههای متعدد تشخیص چهره از آن استفاده میشود. Deepface چیست؟ DeepFace در واقع سبکترین کتابخانه تشخیص چهره و تجزیه و تحلیل ویژگیهای چهره […]
شناسایی مجدد افراد Person Re-Identification مبتنی بر یادگیری عمیق

شناسایی مجدد افراد (Re-ID) برای بازیابی شخص مورد علاقه در چندین دوربین غیر همپوشان استفاده میشود. با پیشرفت شبکههای عصبی عمیق و افزایش تقاضا برای نظارت تصویری هوشمند، این مشکل به طور عمده توجه بیشتری را در جامعه بینایی کامپیوتر به دست آورده است. مشکل شناسایی مجدد افراد شناسایی مجدد افراد یک مشکل خاص در […]
یادگیری نیمه نظارتی Semi-Supervised Learning چیست؟

یادگیری نیمه نظارتی شاخهای از یادگیری ماشینی است که تلاش میکند مشکلاتی را حل کند که به دادههای برچسبدار و بدون برچسب برای آموزش مدلهای هوش مصنوعی نیاز دارند یا شامل آن میشوند. یادگیری نیمه نظارتی از مفاهیم ریاضیات، مانند ویژگیهای هر دو روش خوشهبندی و طبقهبندی استفاده میکند. یادگیری نیمه نظارتی به دلیل در […]
یادگیری بدون ناظر Unsupervised Learning چیست؟

یادگیری بدون ناظر در هوش مصنوعی نوعی یادگیری ماشینی است که از دادههای بدون نظارت انسان یاد میگیرد. برخلاف یادگیری با نظارت، در مدلهای یادگیری بدون نظارت دادههای بدون برچسب به مدل داده میشوند و اجازه داده میشود تا الگوها و بینشهایی را بدون هیچ راهنمایی یا دستورالعمل صریحی کشف کنند. هوش مصنوعی و یادگیری […]
یادگیری با نظارت Supervised Learning چیست؟

یادگیری با نظارت شده که به عنوان یادگیری ماشین نظارت شده نیز شناخته میشود، زیرمجموعهای از یادگیری ماشین و هوش مصنوعی است. مفهوم یادگیری تحت نظارت با استفاده از مجموعه دادههای برچسبگذاریشده برای آموزش الگوریتمهایی که دادهها را طبقهبندی یا نتایج را با دقت پیشبینی میکنند، تعریف میشود. این بدان معناست که دانشمندان داده، هر […]
همه چیز در باره جعبه ابزار OpenVINO محصول اینتل برای یادگیری عمیق

جعبه ابزار OpenVINO یک ابزار یادگیری عمیق بین پلتفرمی است که توسط اینتل توسعه یافته است. عبارت OpenVINO مخفف “Open Visual Inference and Neural Network Optimization” است. تمرکز اصلی OpenVINO بر بهینهسازی استنتاج شبکههای عصبی با رویکرد یکبار نوشتن، استقرار در هر نقطه برای پلتفرمهای سختافزاری اینتل است که شامل ابزار بهینهسازی پس از آموزش […]
معرفی LabelImg برای حاشیهنویسی تصویر

LabelImg یک ابزار حاشیهنویسی تصویر سبک و با کاربرد آسان برای برچسب زدن جعبههای محدود کننده اشیاء در تصاویر است. این مقاله معرفی بر این ابزار، زمان استفاده از آن و نحوه حاشیهنویسی آسان تصاویر را ارائه میدهد. انتخاب نرم افزار حاشیهنویسی تصویر مناسب برای موفقیت بلندمدت برنامههای بینایی کامپیوتری حیاتی است. حاشیهنویسی تصویر چیست؟ […]
حاشیهنویسی تصویر Image Annotation چیست؟

حاشیهنویسی تصویر نقش مهمی در بینایی رایانه ایفا میکند، فناوری که به رایانهها اجازه میدهد تا درک سطح بالایی از تصاویر یا فیلمهای دیجیتال به دست آورند. حاشیه نویسی یا برچسبگذاری تصویر(Image Labeling)، مرحله اولیه در ایجاد الگوریتمهای شناسایی تصویر و مدلهای یادگیری عمیق است. پلتفرمهای نرمافزاری مورد استفاده برای حاشیهنویسی تصویر در سالهای گذشته […]
جمعآوری داده برای بینایی کامپیوتری

این مقاله مقدمهای بر جمعآوری داده برای بینایی کامپیوتری و آموزش آن توسط مدلهای هوش مصنوعی ارائه شده است. آماده سازی دادهها برای یادگیری ماشین (ML) یک گام اساسی به سمت آموزش یک مدل ML با کارایی بالا است که میتواند توسط رایانهها برای تجزیه و تحلیل دادههای ویدیویی یا تصویری استفاده شود. جمعآوری داده […]
بخشبندی تصویر Image Segmentation چیست؟

یکی از مهم ترین عملیات در بینایی کامپیوتر، بخشبندی تصویر یا Image Segmentation است. قطعهبندی تصویر فرآیند تقسیم یک تصویر به چندین قسمت یا ناحیه است که به یک کلاس تعلق دارند. این وظیفه خوشهبندی بر اساس معیارهای خاصی انجام میگردد و میتواند به عنوان مثال بر اساس رنگ یا بافت باشد. به این فرآیند […]
