زمان تخمینی مطالعه: 7 دقیقه
LabelImg یک ابزار حاشیهنویسی تصویر سبک و با کاربرد آسان برای برچسب زدن جعبههای محدود کننده اشیاء در تصاویر است. این مقاله معرفی بر این ابزار، زمان استفاده از آن و نحوه حاشیهنویسی آسان تصاویر را ارائه میدهد. انتخاب نرم افزار حاشیهنویسی تصویر مناسب برای موفقیت بلندمدت برنامههای بینایی کامپیوتری حیاتی است.
حاشیهنویسی تصویر چیست؟
در یادگیری ماشینی (ML) و یادگیری عمیق (DL)، حاشیهنویسی تصویر تکنیک برچسبگذاری یا طبقهبندی تصویر با استفاده از متن حاشیهنویسی، ابزارهای نرم افزاری یا هر دو برای نمایش ویژگیهای دادهای است که میخواهید مدل ML/DL شما به تنهایی شناسایی کند. وقتی حاشیهنویسی تصویر را انجام میدهید، اساساً فراداده را به مجموعه داده اضافه میکنید تا حقیقت اصلی را مشخص کنید. به زبان ساده، حاشیهنویسی تصویر نوعی برچسبگذاری داده است که اغلب به عنوان برچسبگذاری، پردازش یا رونویسی از آن یاد میشود. حاشیهنویسی تصویر هم برای حاشیهنویسی تصویر و هم برای ویدیو کاربرد دارد. درست مانند مجموعهای از تصاویر، فیلمها نیز میتوانند به طور مداوم حاشیهنویسی شوند، مانند فید تصویر یا فریم به فریم.
حاشیهنویسی تصویر ویژگیهایی را که میخواهید سیستم ML یا DL شما شناسایی کند را مشخص میکند. میتوانید از این تصاویر برای آموزش مدل خود از طریق الگوریتمهای یادگیری نظارت شده استفاده کنید. هنگامی که مدل هوش مصنوعی را به عنوان بخشی از یک برنامه بینایی کامپیوتری استقرار میدهید، میخواهید که بتواند روی تصاویری که حاشیهنویسی نشدهاند، شناسایی تصویر انجام دهد و متعاقباً تصمیم بگیرد یا اقدامات لازم را انجام دهد.
این تکنیک عمدتاً برای شناسایی اشیاء و مرزها و بعداً طبقهبندی آنها، به عنوان مثال، درک معنا یا کل تصویر استفاده میشود. زمان قابل توجهی برای آموزش، اعتبارسنجی و ارزیابی یک مدل برای به دست آوردن نتیجه مورد انتظار برای همه این برنامهها زمان میبرد.
- حاشیهنویسی ساده تصویر: این تکنیک ممکن است شامل برچسب زدن یک تصویر با کلماتی باشد که به بهترین نحو اشیاء ذکر شده در آن را نشان میدهد. به عنوان مثال، ممکن است تصویر یک سگ را با برچسب “سگ خانگی” حاشیهنویسی کنید. به این طبقهبندی یا برچسبگذاری تصویر نیز گفته میشود.
- حاشیهنویسی تصویر پیچیده: به عنوان نوعی حاشیهنویسی تصویر تعریف میشود که میتواند برای تشخیص، شمارش یا ردیابی بیش از یک شی یا منطقه در یک تصویر استفاده شود. پیچیدگی حاشیهنویسی شما بر اساس پیچیدگی پروژه شما متفاوت خواهد بود. به عنوان مثال، شما ممکن است تفاوت بین نژادهای سگ را حاشیهنویسی کنید.
اکنون که درک اولیهای از حاشیهنویسی تصویر داریم، بیایید به بررسی معروفترین ابزار نرم افزاری برای حاشیهنویسی تصاویر یعنی LabelImg بپردازیم.
انتخاب نرم افزار حاشیهنویسی تصویر مناسب
تصاویری که برای آموزش، احراز هویت و آزمایش الگوریتمهای بینایی کامپیوتری (CV) خود استفاده میکنید، بر موفقیت پروژه هوش مصنوعی یا یادگیری ماشینی (ML) شما تأثیر زیادی خواهند داشت. هر تصویر در مجموعه داده شما باید با دقت زیاد برچسبگذاری شود تا سیستم هوش مصنوعی یا ML را آموزش دهد تا اشیا را به روشی مانند انسان شناسایی کند. هرچه کیفیت حاشیهنویسیهای شما بالاتر باشد، احتمالاً مدلهای هوش مصنوعی و یادگیری ماشین شما بهتر عمل میکنند. در حالی که مقدار و تنوع دادههای تصویری شما با گذشت زمان افزایش مییابد، حاشیهنویسی تصاویر مطابق با نیاز شما میتواند مشکلی باشد که پروژه شما را خنثی میکند. انتخابهای شما در مورد تکنیکهای حاشیهنویسی تصویر، نرمافزار و نیروی کار شما ارزش توجه صادقانه دارد.
– LabelImg برای حاشیهنویسی تصویر
LabelImg یک نرم افزار رایگان و منبع باز برای برچسبزدن تصاویر با استفاده از گرافها است. این نرم افزار توسط Tzutalin در سال 2015 منتشر شد و به زبان پایتون نوشته شده است. این نرم افزار از QT برای GI (رابط گرافیکی) خود استفاده میکند. LabelImg یک ابزار ساده و اساسی برای برچسبزدن چند صد تصویر برای ایجاد مجموعه داده برای آموزش مدل بینایی کامپیوتری است. در این برنامه حاشیهنویسیها را میتوان به عنوان فایلهای XML در قالب PASCAL VOC ذخیره کرد. Pascal VOC یک فرمت حاشیهنویسی XML رایج است که توسط ImageNet استفاده میشود و قابل خواندن توسط انسان است اما با هیچ مدل تشخیص اشیاء شناخته شدهای کار نمیکند.
– جایگزینهای LabelImg
اگر به دنبال یک نرم افزار حاشیهنویسی ساده، با کاربری آسان و سبک وزن برای تشخیص و طبقهبندی اشیاء هستید، LabelImg ابزار مناسبی برای شروع خواهد بود. این نرم افزار به ویژه برای پروژههای دانشجویی و نمونههای اولیه در مقیاس کوچک مفید است زیرا نصب و اجرای آن بر روی رایانه شخصی آسان است. با این حال، اگر به دنبال حاشیهنویسی تصویر حرفهای و سازمانی هستید، به عملکرد بیشتری فراتر از عملکردهای اصلی LabelImg نیاز خواهید داشت. کسبوکارها معمولاً برای مدیریت دسترسی کاربر با نقشهای مختلف و محافظت از تصاویر و ویدیوهای حساس به راهحل حاشیهنویسی تصویر میزبانی شده نیاز دارند.
همچنین، سایر راه حلهای حاشیهنویسی تصویر، ویژگیهای ویرایشگر حاشیهنویسی بیشتر و حاشیهنویسی تصویر نیمه خودکار را ارائه میدهند که باعث صرفه جویی در زمان و هزینههای زیادی میشود. پلتفرمهای حاشیهنویسی تصویر قابلیتهای یکپارچه جمع آوری دادهها و مدیریت مجموعه دادهها را به همراه گزینههای فرمت خروجی متعدد را ارائه میدهند. در حالی که پلتفرمها و سرویسهای حاشیهنویسی بینایی کامپیوتری زیادی وجود دارد، احتمالاً محبوبترین جایگزین LabelImg را میتوان CVAT (ابزار حاشیهنویسی بینایی رایانه) در نظر گرفت که تمام ویژگیهای فوق را ارائه میکند. این نرم افزار توسط اینتل توسعه یافته و منبع باز است.
نحوه نصب LabelImg
سادهترین راه برای دانلود و نصب این ابزار نرمافزاری از طریق pip است و باید از قبل پایتون 3 را روی دستگاه خود نصب کنید. بنابراین، به سادگی کد pip3 install labelImg را در خط فرمان خود اجرا کنید. پس از آن، میتوانید LabelImg را با تایپ labelImg در خط فرمان خود راه اندازی کنید.
نتیجه گیری
حاشیهنویسی تصویر برای مدلهای بینایی کامپیوتری حیاتی است. عملکرد مدلهای ML تا حد زیادی به کیفیت مجموعه دادههای آموزشی بستگی دارد. فرآیند برچسبزدن تصاویر بسیار خسته کننده است و نیاز به کار دستی دارد. مزایای LabelImg بر اساس سادگی و سهولت استفاده از آن است. با این حال، فاقد ویژگیهای مورد نیاز برای استفاده در مقیاس بزرگتر و حرفهای مانند امنیت و حفظ حریم خصوصی، ابزارهای ویرایشگر حاشیهنویسی، نیمه اتوماسیون بودن و یکپارچهسازی سیستم است. در این حوزه CVAT یک جایگزین مناسب برای کارهایی با همکاری تیمی و یکپارچهسازی شده جهت ذخیرهسازی فایل و مدیریت وظایف است.