تشخیص سوگیری در بینایی کامپیوتر

زمان تخمینی مطالعه: 14 دقیقه

هدف تشخیص سوگیری در بینایی کامپیوتر یافتن و حذف سوگیری‌های(Bias) ناعادلانه است که می‌تواند منجر به خروجی‌های نادرست یا تبعیض آمیز از سیستم‌های بینایی کامپیوتر شود. بینایی کامپیوتر به ویژه در سال‌های اخیر به نتایج قابل توجهی دست‌یافته است و در اکثر وظایف از انسان‌ها بهتر عمل کرده است. با این حال، سیستم‌های CV به شدت به داده‌هایی که روی آن‌ها آموزش دیده‌اند وابسته هستند و می‌توانند یاد بگیرند که تعصب در چنین داده‌هایی را تقویت کنند. بنابراین، شناسایی سوگیری و کاهش تعصب از اهمیت بالایی در این الگوریتم‌ها برخوردار است. این مقاله سایت الکتروهایو، انواع کلیدی سوگیری در بینایی کامپیوتر، تکنیک‌های مورد استفاده برای شناسایی و کاهش آن‌ها، و ابزارهای ضروری و بهترین شیوه‌ها برای ساختن سیستم‌های بینایی کامپیوتر منصفانه‌ را بررسی می‌کند.

انواع و منشاء تشخیص سوگیری در بینایی کامپیوتر

تشخیص سوگیری(Bias Detection) در هوش مصنوعی (AI) به طور کلی به شناسایی خطاها یا تعصبات سیستماتیک در مدل‌های هوش مصنوعی اشاره دارد که سوگیری‌های اجتماعی را تقویت کرده و منجر به نتایج ناعادلانه یا تبعیض آمیز می‌شود. در حالی که سوگیری در سیستم‌های هوش مصنوعی یک حوزه تحقیقاتی به خوبی تثبیت شده است، حوزه بینایی کامپیوتر جانبدارانه آنچنان مورد توجه قرار نگرفته است. این امر با توجه به حجم گسترده داده‌های بصری مورد استفاده در یادگیری ماشین امروزی و اتکای شدید تکنیک‌های یادگیری عمیق مدرن به این داده‌ها برای کارهایی مانند تشخیص اشیاء و طبقه‌بندی تصویر مربوط می‌شود. این سوگیری‌ها در داده‌های بینایی کامپیوتر می‌توانند در مورد راه‌هایی ظاهر شوند که منجر به تبعیض بالقوه در برنامه‌های کاربردی دنیای واقعی مانند تبلیغات هدفمند یا اجرای قانون شود. درک انواع سوگیری که می‌تواند مدل‌های CV را خراب کند، اولین گام به سمت تشخیص و کاهش سوگیری است. توجه به این نکته مهم است که دسته‌بندی سوگیری داده‌های بصری می‌تواند بین منابع متفاوت باشد.

در این بخش رایج‌ترین انواع سوگیری در مجموعه داده‌های بصری برای وظایف بینایی کامپیوتر فهرست می‌شود.

– سوگیری انتخاب Selection Bias

سوگیری انتخاب (که به آن سوگیری نمونه نیز گفته می‌شود) زمانی رخ می‌دهد که نحوه انتخاب تصاویر برای مجموعه داده، عدم تعادل‌هایی را ایجاد می‌کند که اطلاعات دنیای واقعی را منعکس نمی‌کند. این بدان معنی است که مجموعه داده ممکن است گروه‌ها یا موقعیت‌های خاصی را بیش از حد یا کمتر نشان دهد که منجر به یک مدل بالقوه ناعادلانه شود. هنگام جمع‌آوری مجموعه داده‌های معیار مقیاس بزرگ، احتمال بیشتری وجود دارد که انواع خاصی از تصاویر انتخاب شوند، زیرا به تصاویر جمع‌آوری‌شده از منابع آنلاین در دسترس با سوگیری‌های اجتماعی موجود یا روش‌های پاکسازی و فیلتر کردن خودکار بستگی دارند. این امر درک چگونگی تشخیص تعصب نمونه در این مجموعه داده‌ها برای اطمینان از مدل‌های منصفانه‌تر را ضروری می‌سازد. در اینجا چند نمونه هستند:

Caltech101: تصاویر خودرو بیشتر از کناره گرفته شده است
ImageNet: شامل اتومبیل‌های مسابقه‌ای بیشتری است.

بازنمایی کمتر از گروه‌های مختلف می‌تواند منجر به مدل‌هایی شود که افراد را بر اساس ویژگی‌های محافظت‌شده مانند جنسیت یا قومیت به اشتباه طبقه‌بندی یا شناسایی نادرست می‌کنند و در نتیجه پیامدهای دنیای واقعی را به دنبال دارد. مطالعات نشان داد که نرخ خطا برای افراد تیره پوست می‌تواند 18 برابر بیشتر از افراد با پوست روشن در برخی از الگوریتم‌های طبقه‌بندی جنسیتی تجاری باشد.

الگوریتم‌های تشخیص چهره یکی از حوزه‌هایی هستند که تحت‌تاثیر سوگیری نمونه‌گیری قرار می‌گیرند، زیرا بسته به داده‌هایی که روی آن آموزش دیده‌اند، می‌توانند نرخ‌های خطای متفاوتی ایجاد کنند. از این رو، چنین فناوری به مراقبت بسیار بیشتری نیاز دارد، به ویژه در برنامه‌های کاربردی مانند اجرای قانون. با این حال، شایان ذکر است که حتی اگر این عدم تعادل کلاس تأثیر قابل‌توجهی دارد، آنها هر نابرابری را در عملکرد الگوریتم‌های یادگیری ماشین توضیح نمی‌دهند. مثال دیگر، سیستم‌های رانندگی خودکار است، زیرا جمع‌آوری مجموعه داده‌ای که هر صحنه و موقعیت ممکنی را که ممکن است خودرو با آن مواجه شود را توصیف کند، بسیار چالش برانگیز است.

مسئله آموزش سیستم‌های خوردان در اتومبیل‌های خودران چالشی بزرگ برای دانشمندان است.

– سوگیری کادربندی Framing Bias

سوگیری یا تعصب کادربندی به نحوه ثبت، ترکیب و ویرایش تصاویر در یک مجموعه داده بصری اشاره دارد که بر آنچه یک مدل بینایی کامپیوتر می‌آموزد تأثیر می‌گذارد. این سوگیری تأثیر عناصر بصری مانند زاویه، نور، برش و انتخاب‌های فنی مانند تقویت در طول جمع‌آوری تصویر را در بر می‌گیرد. نکته مهم این است که سوگیری کادربندی با سوگیری انتخاب متفاوت است، زیرا هر یک پیچش نیز خود را نشان می‌دهد. یکی از نمونه‌های سوگیری کادربندی، سوگیری ضبط است. تحقیقات نشان می‌دهد که نمایش افراد دارای اضافه وزن در تصاویر می‌تواند به طور قابل توجهی در محتوای بصری متفاوت باشد، به طوری که تصاویر بدون سر در مقایسه با تصاویر افرادی که اضافه وزن ندارند بسیار بیشتر است. این نوع تصاویر اغلب به مجموعه داده‌های بزرگی که برای آموزش سیستم‌های CV استفاده می‌شوند، مانند موتورهای جستجوی تصویر، راه پیدا می‌کنند. حتی برای ما، تصمیمات ما تحت تأثیر نحوه چارچوب‌بندی برخی چیزها است زیرا این یک استراتژی بازاریابی است که به طور گسترده مورد استفاده قرار می‌گیرد. به عنوان مثال، یک مشتری یک بطری شیر با برچسب بدون چربی 80٪ را به یک بطری با 20٪ چربی ترجیح می‌دهد، حتی اگر محتوای آنها یکی باشد.

اثرات سوگیری کادر‌بندی در برنامه‌های بینایی کامپیوتر

سوگیری کادربندی در جستجوی تصویر می‌تواند منجر به نتایجی شود که کلیشه‌های مضر را حتی بدون عبارات جستجوی صریح تداوم می‌بخشد. به عنوان مثال، جستجو برای یک حرفه عمومی مانند “کارگر ساختمانی” ممکن است منجر به عدم تعادل جنسیتی در نمایش شود. صرف نظر از اینکه خود الگوریتم بایاس است یا به سادگی سوگیری‌های موجود را منعکس می‌کند، نتیجه نمایش‌های منفی را تقویت می‌کند. این امر بر اهمیت تشخیص سوگیری در بینایی کامپیوتر تاکید می‌کند.

– سوگیری برچسب Label Bias

داده‌های برچسب‌گذاری‌شده برای یادگیری با نظارت ضروری هستند، و کیفیت آن برچسب‌ها برای هر مدل یادگیری ماشین، به‌ویژه در بینایی کامپیوتر، حیاتی است. خطاها و سوگیری‌های برچسب‌گذاری به دلیل پیچیدگی و حجم آن‌ها می‌توانند در مجموعه داده‌های امروزی بسیار رایج باشند و تشخیص سوگیری در آن مجموعه داده‌ها را به چالش می‌کشند. ما می‌توانیم سوگیری برچسب را به عنوان تفاوت بین برچسب‌های اختصاص داده شده به تصاویر و حقیقت اصلی آنها تعریف کنیم، این شامل اشتباهات یا ناسازگاری در نحوه طبقه‌بندی داده های بصری است. این موضوع می‌تواند زمانی اتفاق بیفتد که برچسب‌ها محتوای واقعی تصویر را منعکس نمی‌کنند، یا زمانی که دسته‌بندی برچسب‌ها خود مبهم یا گمراه کننده هستند.

اثرات سوگیری برچسب‌گذاری در برنامه‌های بینایی کامپیوتر

با این وجود، این امر به ویژه با تصاویر مربوط به انسان مشکل ساز می‌شود. برای مثال، سوگیری برچسب می‌تواند شامل سوگیری مجموعه‌ای منفی باشد که در آن برچسب‌ها نمی‌توانند تنوع کامل یک دسته را نشان دهند. برای مقابله با چالش‌هایی مانند تعصب‌نژادی، استفاده از ویژگی‌های بصری خاص یا ویژگی‌های قابل اندازه‌گیری (مانند بازتاب پوست) اغلب دقیق‌تر از مقوله‌های ذهنی مانند نژاد است. یک الگوریتم طبقه‌بندی که بر روی برچسب‌های بایاس آموزش داده شده است، احتمالاً هنگام استفاده در داده‌های جدید، این سوگیری‌ها را تقویت می‌کند. این امر اهمیت تشخیص سوگیری را در اوایل چرخه حیات داده‌های بصری برجسته می‌کند.

چرخه حیات داده‌های بصری

درک چگونگی تشخیص سوگیری در منبع آن بسیار مهم است. چرخه حیات محتوای بصری یک چارچوب مفید برای این ارائه می‌دهد. این موضوع نشان می‌دهد که سوگیری می‌تواند در چند مرحله معرفی یا تقویت شود.

تصویر ساده شده از چرخه حیات محتوای بصری و منابع مرتبط با سوگیری.

چرخه حیات پتانسیل سوگیری‌هایی مانند سوگیری عکسبرداری را نشان می‌دهد (زوایای دوربین بر ادراک تأثیر می‌گذارد). با توجه به فرآیندهای نشان داده شده در تصویر، سوگیری‌های دیگری نیز می‌توانند در طول چرخه حیات محتوای بصری رخ دهند. این شامل سوگیری در دسترس بودن (با استفاده از داده‌های به راحتی در دسترس)، یا سوگیری اتوماسیون (اتوماتیک کردن فرآیند برچسب‌گذاری و/یا جمع‌آوری) است. در این مقاله ما، انواع اصلی بایاس را ذکر کردیم، زیرا سایر سوگیری‌ها معمولاً زیر مجموعه این موارد هستند. این سوگیری‌ها اغلب بر هم اثر می‌گذارند و همپوشانی ایجاد می‌کنند، زیرا انواع مختلف سوگیری می‌توانند همزمان رخ دهند و تشخیص سوگیری را حتی مهم‌تر می‌کنند.

تکنیک‌های تشخیص سوگیری در بینایی کامپیوتر

تشخیص بایاس در مجموعه داده‌های بصری گامی حیاتی در جهت ایجاد سیستم‌های بینایی کامپیوتر منصفانه و قابل اعتماد است. محققان طیف وسیعی از تکنیک‌ها را برای کشف این سوگیری‌ها توسعه داده‌اند و از ایجاد مدل‌های عادلانه‌تر اطمینان می‌دهند. بیایید چند رویکرد کلیدی در این حوزه را بررسی کنیم.

کاهش به داده‌های جدولی Reduction To Tabular Data: این دسته از روش‌ها بر روی ویژگی‌ها و برچسب‌های مرتبط با تصاویر تمرکز می‌کنند. با استخراج این اطلاعات و نمایش آن در قالب جدولی، محققان می‌توانند روش‌های تشخیص سوگیری به خوبی تثبیت شده برای مجموعه داده‌های جدولی را اعمال کنند. ویژگی‌های استخراج‌شده برای این نمایش جدولی می‌تواند مستقیماً از تصاویر با استفاده از ابزارهای تشخیص و تشخیص تصویر یا از ابرداده‌های موجود مانند زیرنویس‌ها یا ترکیبی از هر دو باشد. تجزیه و تحلیل بیشتر داده های جدولی استخراج شده راه‌های مختلفی را برای ارزیابی سوگیری احتمالی را نشان می‌دهد.
نمایش‌های بصری متعصبانه: در حالی که کاهش داده‌های تصویر به داده‌های جدولی می‌تواند ارزشمند باشد، گاهی اوقات تجزیه و تحلیل نمایش‌های تصویر بینش‌های منحصربه‌فردی را در مورد سوگیری ارائه می‌دهد. این روش‌ها بر نمایش‌های با ابعاد پایین‌تر از تصاویر تمرکز می‌کنند، که نشان می‌دهد چگونه یک مدل یادگیری ماشین ممکن است آنها را ببیند و گروه‌بندی کند. ابن نحوه نمایش برای تشخیص سوگیری بر تجزیه و تحلیل فواصل و روابط هندسی تصاویر در فضایی با ابعاد کمتر متکی هستند. روش‌های این دسته شامل روش‌های مبتنی بر فاصله و روش‌های دیگر است. برای استفاده از این روش‌ها، محققان مطالعه می‌کنند که چگونه مدل‌های از پیش آموزش‌دیده تصاویر را در فضایی با ابعاد پایین‌تر نشان می‌دهند، و فاصله بین آن نمایش‌ها را برای تشخیص سوگیری در مجموعه داده‌های بصری محاسبه می‌کنند.
تشخیص سوگیری بین مجموعه‌ای از داده‌ها: این روش‌ها مجموعه داده‌های مختلف را با هم مقایسه می‌کنند و «امضاهایی» را که سوگیری‌ها را آشکار می‌کنند، جستجو می‌کنند. این مفهوم “امضا” از این واقعیت ناشی می‌شود که محققان باتجربه اغلب می‌توانند تشخیص دهند که یک تصویر از کدام مجموعه داده معیار با دقت خوبی می‌آید. این امضاها (سوگیری‌ها) الگوها یا ویژگی‌های منحصر به فردی در یک مجموعه داده هستند که معمولاً بر توانایی یک مدل برای تعمیم به خوبی بر روی داده‌های نادیده جدید تأثیر می‌گذارند. تعمیم داده‌های متقابل یکی از روش‌های مورد استفاده در این دسته است که آزمایش می‌کند یک مدل چقدر به زیرمجموعه‌ای از داده‌هایی که در آن آموزش ندیده تعمیم می‌یابد.
سایر روش‌ها: برخی از روش‌ها تحت هیچ یک از دسته‌بندی‌های ذکر شده تا کنون قرار نمی‌گیرند. مدل‌های یادگیری عمیق ذاتاً روش‌های جعبه سیاه هستند، و حتی اگر آن مدل‌ها بیشترین موفقیت را در وظایف بینایی داشتند، توضیح‌پذیری آنها هنوز ضعیف ارزیابی می‌شود.

راهکارهای کاهش سوگیری در بینایی کامپیوتر

با تکیه بر تکنیک‌های تشخیص سوگیری در بینایی کامپیوتر که قبلاً بررسی کردیم، محققان مجموعه داده‌های معیار محبوب را تجزیه و تحلیل می‌کنند تا انواع سوگیری موجود در آن‌ها را شناسایی کنند و از ایجاد مجموعه‌های داده منصفانه‌تر مطمئن شوند. از آنجایی که سوگیری مجموعه داده منجر به سوگیری الگوریتمی می‌شود، استراتژی‌های کاهش معمولاً بر بهترین شیوه‌ها برای ایجاد مجموعه داده و نمونه‌برداری تمرکز می‌کنند. این رویکرد به ما امکان می‌دهد تا یک فرآیند جمع‌آوری داده‌های بصری آگاه از تعصب داشته باشیم تا سوگیری را از پایه مدل‌های بینایی کامپیوتر به حداقل برسانیم. این بخش به تشریح تکنیک‌های کاهش عملی سوگیری می‌پردازد که بر سه حوزه تمرکزی تقسیم می‌شوند:

ایجاد مجموعه داده:
- تلاش برای نمایندگی متعادل: با استفاده از مثال‌های متنوع از نظر جنسیت، رنگ پوست، سن و سایر ویژگی‌های محافظت‌شده، می‌توان با سوگیری انتخاب مبارزه کرد. نمونه‌برداری بیش از حد از گروه‌هایی که کمتر نشان داده شده‌اند یا تنظیم دقیق ترکیب داده‌ها می‌تواند این تعادل را تقویت کند. به عنوان مثال، یک مجموعه داده شامل فقط بزرگسالان جوان را می‌توان با افزودن تصاویر سالمندان متعادل کرد.
- برچسب‌ها را به طور انتقادی در نظر بگیرید: مراقب باشید که برچسب‌ها چگونه می‌توانند سوگیری را معرفی کنند و در صورت امکان، رویکردهای برچسب‌گذاری دقیق‌تری را در نظر بگیرید. تحمیل مقولاتی مانند دسته‌بندی‌های نژادی بیش از حد ساده می‌تواند خود نوعی سوگیری باشد. به‌عنوان مثال، به‌جای برچسب «آسیایی»، در صورت لزوم، شناسه‌های منطقه‌ای یا فرهنگی خاص‌تری را وارد کنید.
- چالش‌های جمع‌سپاری(Crowdsourcing): حاشیه‌نویس‌های جمع‌سپاری معمولاً ناسازگاری دارند، زیرا حاشیه‌نویس‌های فردی می‌توانند سوگیری‌های بالقوه‌ای داشته باشند. بنابراین، اگر از حاشیه‌نویسی جمع سپاری استفاده می‌کنید، مطمئن شوید که مکانیسم‌های کنترل کیفیت را اجرا کنید. به عنوان مثال، به حاشیه‌نویسان دستورالعمل‌ها و آموزش‌های روشنی در مورد سوگیری‌های احتمالی ارائه دهید.
فرآیندهای جمع آوری:
- نمایش محیط‌های متنوع: برای جلوگیری از تعصب در کادربندی، مطمئن شوید که تنوع در نور، زوایای دوربین، پس‌زمینه و نمایش سوژه را ثبت کنید. معرفی داده‌های مصنوعی می‌تواند تنوع بیشتری به تنظیمات تصاویر بدهد. این امر از تطبیق بیش از حد مدل‌ها با زمینه‌ها یا شرایط نوری خاص جلوگیری می‌کند و امکان اندازه نمونه مناسب را فراهم می‌کند. به عنوان مثال، عکس‌هایی که هم در داخل و هم در فضای باز گرفته شده‌اند.
- مراقب حذف باشید: تأثیر بالقوه حذف کلاس‌های شیء خاص بر عملکرد مدل را در نظر بگیرید. این همچنین بر نمونه‌های منفی تأثیر می‌گذارد، حذف کلاس‌های شیء عمومی («افراد»، «تخت‌ها») می‌تواند تعادل را تغییر دهد.
ملاحظات گسترده‌تر:
- گسترش دامنه جغرافیایی: سوگیری جغرافیایی یکی از انواع سوگیری‌های نمونه است. این سوگیری در طیف گسترده‌ای از مجموعه داده‌ها وجود دارد که ایالات متحده محور یا اروپا محور هستند. بنابراین، گنجاندن تصاویر از مناطق مختلف برای مبارزه با این سوگیری مهم است. به عنوان مثال، جمع آوری تصاویر از کشورهای مختلف در چندین قاره.
- پیچیدگی هویت را تصدیق کنید: برچسب‌های جنسیتی باینری گاهی اوقات نمی‌توانند هویت جنسیتی را منعکس کنند و به رویکردهای متفاوتی نیاز دارند. بنابراین، نمایش فراگیر در مجموعه داده‌ها می‌تواند مفید واقع شود.

نتیجه گیری

این مقاله مقدمه‌ای پایه‌ای برای درک تشخیص سوگیری در بینایی کامپیوتر، پوشش انواع سوگیری، روش‌های تشخیص و استراتژی‌های کاهش ارائه می‌کند. همانطور که در بخش‌های قبلی اشاره شد، سوگیری در طول چرخه زندگی داده‌های بصری فراگیر است. تحقیقات بیشتر باید نمایش‌های غنی‌تری از داده‌های بصری، رابطه بین تعصب و هندسه فضای پنهان، و تشخیص سوگیری در ویدیو را بررسی کند. برای کاهش سوگیری، ما به شیوه‌های جمع‌آوری داده عادلانه‌تر و آگاهی بیشتر از سوگیری‌ها در آن مجموعه داده‌ها نیاز داریم.

برچسب خوردهکامپیوتر ویژن, یادگیری عمیق, یادگیری ماشین