الکتروهایو

هوش مصنوعی / الکترونیک / برنامه‌نویسی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

همه چیز درباره دیتاست COCO مایکروسافت

همه چیز درباره دیتاست COCO مایکروسافت - سایت الکتروهایو
در این مقاله می‌خوانید:

زمان تخمینی مطالعه: 4 دقیقه

COCO یک مجموعه داده بصری است که نقش مهمی در بینایی رایانه ایفا می‌کند. در این مقاله، همه چیزهایی را که باید در مورد مجموعه داده محبوب COCO مایکروسافت بدانید که به طور گسترده برای پروژه‌های یادگیری ماشینی استفاده می‌شود، پوشش خواهیم داد. در این نوشته یاد می‌گیریم که با دیتاست COCO چه کاری می‌توانیم انجام دهیم و چه چیزی آن را از جایگزین‌های دیگر مانند OID Google (Open Images Dataset) متفاوت می‌کند.

دیتاست COCO

مجموعه داده MS COCO یک مجموعه داده تشخیص اشیاء، بخش‌بندی تصویر و زیرنویس در مقیاس بزرگ است که توسط مایکروسافت منتشر شده است. مهندسان یادگیری ماشین و بینایی کامپیوتر معمولاً از دیتاست COCO برای پروژه‌های مختلف بینایی رایانه استفاده می‌کنند. درک صحنه‌های بصری هدف اصلی بینایی کامپیوتری است. این شامل تشخیص اینکه چه اشیایی در صحنه وجود دارند، محلی‌سازی اشیاء به صورت دو بعدی و سه بعدی، تعیین ویژگی‌های شی، و مشخص کردن رابطه بین اشیاء است. بنابراین، الگوریتم‌های تشخیص شی و طبقه‌بندی شی را می‌توان با استفاده از مجموعه داده آموزش داد.

تشخیص نقطه کلیدی برای تخمین موقعیت در دیتاست COCO.

COCO مخفف Common Objects in Context است، زیرا مجموعه داده تصویر با هدف ارتقای تشخیص تصویر ایجاد شده است. مجموعه داده COCO شامل مجموعه داده‌های بصری چالش برانگیز و با کیفیت برای بینایی کامپیوتری است که عمدتاً شبکه‌های عصبی پیشرفته هستند. به عنوان مثال، COCO اغلب برای معیار الگوریتم‌ها برای مقایسه عملکرد تشخیص اشیاء در زمان واقعی استفاده می‌شود. قالب مجموعه داده COCO به طور خودکار توسط کتابخانه‌های شبکه عصبی پیشرفته تفسیر می‌شود.

ویژگی‌های دیتاست COCO

در زیر مجموعه‌ای از ویژگی‌های دیتاست MS COCO آورده شده است:

  • بخش‌بندی شی با حاشیه‌نویسی نمونه دقیق
  • شناسایی در زمینه(Context)
  • بخش‌بندی اشیاء در حد سوپرپیکسل
  • دارای بیش از 200000 تصویر برچسب‌گذاری شده از مجموع 330000 تصویر
  • 1.5 میلیون نمونه شی
  • 80 دسته مختلف برای اشیاء، “کلاس‌های COCO”، که شامل “چیزهایی” است که نمونه‌های فردی را می‌توان به راحتی برچسب‌گذاری کرد (شخص، ماشین، صندلی و غیره)
کلاس‌های 80 گانه دیتاست COCO
  • 91 دسته موارد(Stuff)، که در آن «stuff COCO» شامل مواد و اشیاء بدون مرز مشخص (آسمان، خیابان، چمن، و غیره) است که اطلاعات زمینه‌ای قابل توجهی را ارائه می‌کنند.
  • 5 زیرنویس(کپشن) در هر تصویر
  • 250000 نفر با 17 نقطه کلیدی مختلف که به طور رایج برای تخمین موقعیت(pose) استفاده می‌شود
17 نقطه کلیدی در دیتاست MS COCO

حاشیه‌نویسی تصاویر دیتاست COCO

مجموعه داده بزرگ شامل عکس‌های حاشیه‌نویسی از صحنه‌های روزمره اشیاء معمولی در زمینه(Context) طبیعی آنها است. این اشیاء با استفاده از کلاس‌های از پیش تعریف شده مانند “صندلی” یا “موز” برچسب‌گذاری می‌شوند.

مجموعه داده MSCOCO شامل حاشیه‌نویسی تصویری دقیق از تصاویر است که صحنه‌های پیچیده روزمره اشیاء معمولی را در زمینه طبیعی آنها به تصویر می‌کشد.

فرآیند برچسب‌گذاری که به آن حاشیه‌نویسی تصویر نیز گفته می‌شود و یک تکنیک بسیار محبوب در بینایی کامپیوتر است. در حالی که سایر مجموعه‌های داده شناسایی اشیاء بر 1) طبقه‌بندی تصویر، 2) محلی‌سازی جعبه محدودکننده شی، یا 3) تقسیم‌بندی معنایی در سطح پیکسل متمرکز شده‌اند – مجموعه داده MS COCO بر روی 4) تقسیم‌بندی نمونه‌های شی منفرد تمرکز دارد.

لوگو الکتروهایو

الکتروهایو در خدمت مخاطبان عزیز می‌باشد. ما در تیم الکتروهایو در تلاش برای تهیه مقالات و مطالب به روز هستیم. لطفا برای مطالب و مقالات بیشتر با ما همراه باشید.

مطالب مرتبط:

داده‌های اسمی Nominal Data - الکتروهایو

داده‌های اسمی Nominal Data چیست؟

داده‌های اسمی(Nominal Data) یکی از اساسی‌ترین انواع داده‌ها در تجزیه و تحلیل داده‌ها است. شناسایی و تفسیر آن در بسیاری از زمینه‌ها از جمله آمار، علوم کامپیوتر، روانشناسی و بازاریابی ضروری است. این مقاله ویژگی‌ها، کاربردها و تفاوت‌های داده‌های اسمی

ادامه مطلب »
حاشیه‌نویسی متن در هوش مصنوعی - سایت الکتروهایو

حاشیه‌نویسی متن در هوش مصنوعی

حاشیه‌نویسی داده به الگوریتم‌های یادگیری ماشین اجازه می‌دهد تا اطلاعات را درک و تفسیر کنند. حاشیه‌نویسی‌ها برچسب‌هایی هستند که داده‌ها را شناسایی و طبقه‌بندی می‌کنند یا قطعات مختلف اطلاعات را با یکدیگر مرتبط می‌کنند. الگوریتم‌های هوش مصنوعی از آنها به

ادامه مطلب »
هوش مصنوعی در باستان شناسی و کاربردهای آن - سایت الکتروهایو

هوش مصنوعی در باستان شناسی چه کاربردهای می‌تواند داشته باشد؟

مکان‌های باستان‌شناسی ممکن است ثابت باشند، اما فرهنگ‌هایی که آنها را تولید کرده‌اند، پویا و متنوع بودند. برخی از آنها کاملاً عشایری بودند و مرتباً موقعیت خود را تغییر می‌دادند. برخی از آنها فواصل بسیار زیادی را مهاجرت کردند، در

ادامه مطلب »
با الگوریتم تشخیص اشیاء FCOS آشنا شوید - سایت الکتروهایو

با الگوریتم تشخیص اشیاء FCOS آشنا شوید: تشخیص اشیاء تک مرحله‌ای کاملاً کانولوشنال

تشخیص اشیاء یک کار مهم در بینایی کامپیوتر است که با رسم کادرهای محدود کننده در اطراف اشیاء شناسایی شده، مکان یک شی را در یک تصویر شناسایی و مکان‌یابی می‌کند. اهمیت تشخیص اشیاء را نمی‌توان به اندازه کافی بیان

ادامه مطلب »
با سایت Kaggle آشنا شوید! دریچه‌ای رو به دنیای اجتماع متخصصان هوش مصنوعی - سایت الکتروهایو

با سایت Kaggle آشنا شوید! دریچه‌ای رو به دنیای اجتماع متخصصان هوش مصنوعی

یادگیری ماشین (Machine Learning) و علم داده (Data Science) موضوعاتی هستند که در تمامی بخش‌های فناوری اطلاعات در مورد آن بحث و گفتگو وجود دارد. امروزه همه چیز در حال خودکار شدن است، و برنامه‌های کاربردی نیز به سرعت در

ادامه مطلب »
داده‌های اسمی Nominal Data - الکتروهایو

داده‌های اسمی Nominal Data چیست؟

داده‌های اسمی(Nominal Data) یکی از اساسی‌ترین انواع داده‌ها در تجزیه و تحلیل داده‌ها است. شناسایی ...

حاشیه‌نویسی متن در هوش مصنوعی - سایت الکتروهایو

حاشیه‌نویسی متن در هوش مصنوعی

حاشیه‌نویسی داده به الگوریتم‌های یادگیری ماشین اجازه می‌دهد تا اطلاعات را درک و تفسیر کنند. ...

هوش مصنوعی در باستان شناسی و کاربردهای آن - سایت الکتروهایو

هوش مصنوعی در باستان شناسی چه کاربردهای می‌تواند داشته باشد؟

مکان‌های باستان‌شناسی ممکن است ثابت باشند، اما فرهنگ‌هایی که آنها را تولید کرده‌اند، پویا و ...

با الگوریتم تشخیص اشیاء FCOS آشنا شوید - سایت الکتروهایو

با الگوریتم تشخیص اشیاء FCOS آشنا شوید: تشخیص اشیاء تک مرحله‌ای کاملاً کانولوشنال

تشخیص اشیاء یک کار مهم در بینایی کامپیوتر است که با رسم کادرهای محدود کننده ...

تصویربرداری چند طیفی، دیدی جدید فراسوی نور مرئی - سایت الکتروهایو

تصویربرداری چند طیفی، دیدی جدید فراسوی نور مرئی

تصویربرداری چند طیفی تکنیکی است که نور را در طیف وسیعی از باندهای طیفی، فراتر ...