زمان تخمینی مطالعه: 14 دقیقه

هدف تشخیص سوگیری در بینایی کامپیوتر یافتن و حذف سوگیری‌های(Bias) ناعادلانه است که می‌تواند منجر به خروجی‌های نادرست یا تبعیض آمیز از سیستم‌های بینایی کامپیوتر شود. بینایی کامپیوتر به ویژه در سال‌های اخیر به نتایج قابل توجهی دست‌یافته است و در اکثر وظایف از انسان‌ها بهتر عمل کرده است. با این حال، سیستم‌های CV به شدت به داده‌هایی که روی آن‌ها آموزش دیده‌اند وابسته هستند و می‌توانند یاد بگیرند که تعصب در چنین داده‌هایی را تقویت کنند. بنابراین، شناسایی سوگیری و کاهش تعصب از اهمیت بالایی در این الگوریتم‌ها برخوردار است. این مقاله سایت الکتروهایو، انواع کلیدی سوگیری در بینایی کامپیوتر، تکنیک‌های مورد استفاده برای شناسایی و کاهش آن‌ها، و ابزارهای ضروری و بهترین شیوه‌ها برای ساختن سیستم‌های بینایی کامپیوتر منصفانه‌ را بررسی می‌کند.

انواع و منشاء تشخیص سوگیری در بینایی کامپیوتر

تشخیص سوگیری(Bias Detection) در هوش مصنوعی (AI) به طور کلی به شناسایی خطاها یا تعصبات سیستماتیک در مدل‌های هوش مصنوعی اشاره دارد که سوگیری‌های اجتماعی را تقویت کرده و منجر به نتایج ناعادلانه یا تبعیض آمیز می‌شود. در حالی که سوگیری در سیستم‌های هوش مصنوعی یک حوزه تحقیقاتی به خوبی تثبیت شده است، حوزه بینایی کامپیوتر جانبدارانه آنچنان مورد توجه قرار نگرفته است. این امر با توجه به حجم گسترده داده‌های بصری مورد استفاده در یادگیری ماشین امروزی و اتکای شدید تکنیک‌های یادگیری عمیق مدرن به این داده‌ها برای کارهایی مانند تشخیص اشیاء و طبقه‌بندی تصویر مربوط می‌شود. این سوگیری‌ها در داده‌های بینایی کامپیوتر می‌توانند در مورد راه‌هایی ظاهر شوند که منجر به تبعیض بالقوه در برنامه‌های کاربردی دنیای واقعی مانند تبلیغات هدفمند یا اجرای قانون شود. درک انواع سوگیری که می‌تواند مدل‌های CV را خراب کند، اولین گام به سمت تشخیص و کاهش سوگیری است. توجه به این نکته مهم است که دسته‌بندی سوگیری داده‌های بصری می‌تواند بین منابع متفاوت باشد.

در این بخش رایج‌ترین انواع سوگیری در مجموعه داده‌های بصری برای وظایف بینایی کامپیوتر فهرست می‌شود.

– سوگیری انتخاب Selection Bias

سوگیری انتخاب (که به آن سوگیری نمونه نیز گفته می‌شود) زمانی رخ می‌دهد که نحوه انتخاب تصاویر برای مجموعه داده، عدم تعادل‌هایی را ایجاد می‌کند که اطلاعات دنیای واقعی را منعکس نمی‌کند. این بدان معنی است که مجموعه داده ممکن است گروه‌ها یا موقعیت‌های خاصی را بیش از حد یا کمتر نشان دهد که منجر به یک مدل بالقوه ناعادلانه شود. هنگام جمع‌آوری مجموعه داده‌های معیار مقیاس بزرگ، احتمال بیشتری وجود دارد که انواع خاصی از تصاویر انتخاب شوند، زیرا به تصاویر جمع‌آوری‌شده از منابع آنلاین در دسترس با سوگیری‌های اجتماعی موجود یا روش‌های پاکسازی و فیلتر کردن خودکار بستگی دارند. این امر درک چگونگی تشخیص تعصب نمونه در این مجموعه داده‌ها برای اطمینان از مدل‌های منصفانه‌تر را ضروری می‌سازد. در اینجا چند نمونه هستند:

بازنمایی کمتر از گروه‌های مختلف می‌تواند منجر به مدل‌هایی شود که افراد را بر اساس ویژگی‌های محافظت‌شده مانند جنسیت یا قومیت به اشتباه طبقه‌بندی یا شناسایی نادرست می‌کنند و در نتیجه پیامدهای دنیای واقعی را به دنبال دارد. مطالعات نشان داد که نرخ خطا برای افراد تیره پوست می‌تواند 18 برابر بیشتر از افراد با پوست روشن در برخی از الگوریتم‌های طبقه‌بندی جنسیتی تجاری باشد.

الگوریتم‌های تشخیص چهره یکی از حوزه‌هایی هستند که تحت‌تاثیر سوگیری نمونه‌گیری قرار می‌گیرند، زیرا بسته به داده‌هایی که روی آن آموزش دیده‌اند، می‌توانند نرخ‌های خطای متفاوتی ایجاد کنند. از این رو، چنین فناوری به مراقبت بسیار بیشتری نیاز دارد، به ویژه در برنامه‌های کاربردی مانند اجرای قانون. با این حال، شایان ذکر است که حتی اگر این عدم تعادل کلاس تأثیر قابل‌توجهی دارد، آنها هر نابرابری را در عملکرد الگوریتم‌های یادگیری ماشین توضیح نمی‌دهند. مثال دیگر، سیستم‌های رانندگی خودکار است، زیرا جمع‌آوری مجموعه داده‌ای که هر صحنه و موقعیت ممکنی را که ممکن است خودرو با آن مواجه شود را توصیف کند، بسیار چالش برانگیز است.

مسئله آموزش سیستم‌های خوردان در اتومبیل‌های خودران چالشی بزرگ برای دانشمندان است.

– سوگیری کادربندی Framing Bias

سوگیری یا تعصب کادربندی به نحوه ثبت، ترکیب و ویرایش تصاویر در یک مجموعه داده بصری اشاره دارد که بر آنچه یک مدل بینایی کامپیوتر می‌آموزد تأثیر می‌گذارد. این سوگیری تأثیر عناصر بصری مانند زاویه، نور، برش و انتخاب‌های فنی مانند تقویت در طول جمع‌آوری تصویر را در بر می‌گیرد. نکته مهم این است که سوگیری کادربندی با سوگیری انتخاب متفاوت است، زیرا هر یک پیچش نیز خود را نشان می‌دهد. یکی از نمونه‌های سوگیری کادربندی، سوگیری ضبط است. تحقیقات نشان می‌دهد که نمایش افراد دارای اضافه وزن در تصاویر می‌تواند به طور قابل توجهی در محتوای بصری متفاوت باشد، به طوری که تصاویر بدون سر در مقایسه با تصاویر افرادی که اضافه وزن ندارند بسیار بیشتر است. این نوع تصاویر اغلب به مجموعه داده‌های بزرگی که برای آموزش سیستم‌های CV استفاده می‌شوند، مانند موتورهای جستجوی تصویر، راه پیدا می‌کنند. حتی برای ما، تصمیمات ما تحت تأثیر نحوه چارچوب‌بندی برخی چیزها است زیرا این یک استراتژی بازاریابی است که به طور گسترده مورد استفاده قرار می‌گیرد. به عنوان مثال، یک مشتری یک بطری شیر با برچسب بدون چربی 80٪ را به یک بطری با 20٪ چربی ترجیح می‌دهد، حتی اگر محتوای آنها یکی باشد.

اثرات سوگیری کادر‌بندی در برنامه‌های بینایی کامپیوتر

سوگیری کادربندی در جستجوی تصویر می‌تواند منجر به نتایجی شود که کلیشه‌های مضر را حتی بدون عبارات جستجوی صریح تداوم می‌بخشد. به عنوان مثال، جستجو برای یک حرفه عمومی مانند “کارگر ساختمانی” ممکن است منجر به عدم تعادل جنسیتی در نمایش شود. صرف نظر از اینکه خود الگوریتم بایاس است یا به سادگی سوگیری‌های موجود را منعکس می‌کند، نتیجه نمایش‌های منفی را تقویت می‌کند. این امر بر اهمیت تشخیص سوگیری در بینایی کامپیوتر تاکید می‌کند.

– سوگیری برچسب Label Bias

داده‌های برچسب‌گذاری‌شده برای یادگیری با نظارت ضروری هستند، و کیفیت آن برچسب‌ها برای هر مدل یادگیری ماشین، به‌ویژه در بینایی کامپیوتر، حیاتی است. خطاها و سوگیری‌های برچسب‌گذاری به دلیل پیچیدگی و حجم آن‌ها می‌توانند در مجموعه داده‌های امروزی بسیار رایج باشند و تشخیص سوگیری در آن مجموعه داده‌ها را به چالش می‌کشند. ما می‌توانیم سوگیری برچسب را به عنوان تفاوت بین برچسب‌های اختصاص داده شده به تصاویر و حقیقت اصلی آنها تعریف کنیم، این شامل اشتباهات یا ناسازگاری در نحوه طبقه‌بندی داده های بصری است. این موضوع می‌تواند زمانی اتفاق بیفتد که برچسب‌ها محتوای واقعی تصویر را منعکس نمی‌کنند، یا زمانی که دسته‌بندی برچسب‌ها خود مبهم یا گمراه کننده هستند.

اثرات سوگیری برچسب‌گذاری در برنامه‌های بینایی کامپیوتر

با این وجود، این امر به ویژه با تصاویر مربوط به انسان مشکل ساز می‌شود. برای مثال، سوگیری برچسب می‌تواند شامل سوگیری مجموعه‌ای منفی باشد که در آن برچسب‌ها نمی‌توانند تنوع کامل یک دسته را نشان دهند. برای مقابله با چالش‌هایی مانند تعصب‌نژادی، استفاده از ویژگی‌های بصری خاص یا ویژگی‌های قابل اندازه‌گیری (مانند بازتاب پوست) اغلب دقیق‌تر از مقوله‌های ذهنی مانند نژاد است. یک الگوریتم طبقه‌بندی که بر روی برچسب‌های بایاس آموزش داده شده است، احتمالاً هنگام استفاده در داده‌های جدید، این سوگیری‌ها را تقویت می‌کند. این امر اهمیت تشخیص سوگیری را در اوایل چرخه حیات داده‌های بصری برجسته می‌کند.

چرخه حیات داده‌های بصری

درک چگونگی تشخیص سوگیری در منبع آن بسیار مهم است. چرخه حیات محتوای بصری یک چارچوب مفید برای این ارائه می‌دهد. این موضوع نشان می‌دهد که سوگیری می‌تواند در چند مرحله معرفی یا تقویت شود.

تصویر ساده شده از چرخه حیات محتوای بصری و منابع مرتبط با سوگیری.

چرخه حیات پتانسیل سوگیری‌هایی مانند سوگیری عکسبرداری را نشان می‌دهد (زوایای دوربین بر ادراک تأثیر می‌گذارد). با توجه به فرآیندهای نشان داده شده در تصویر، سوگیری‌های دیگری نیز می‌توانند در طول چرخه حیات محتوای بصری رخ دهند. این شامل سوگیری در دسترس بودن (با استفاده از داده‌های به راحتی در دسترس)، یا سوگیری اتوماسیون (اتوماتیک کردن فرآیند برچسب‌گذاری و/یا جمع‌آوری) است. در این مقاله ما، انواع اصلی بایاس را ذکر کردیم، زیرا سایر سوگیری‌ها معمولاً زیر مجموعه این موارد هستند. این سوگیری‌ها اغلب بر هم اثر می‌گذارند و همپوشانی ایجاد می‌کنند، زیرا انواع مختلف سوگیری می‌توانند همزمان رخ دهند و تشخیص سوگیری را حتی مهم‌تر می‌کنند.

تکنیک‌های تشخیص سوگیری در بینایی کامپیوتر

تشخیص بایاس در مجموعه داده‌های بصری گامی حیاتی در جهت ایجاد سیستم‌های بینایی کامپیوتر منصفانه و قابل اعتماد است. محققان طیف وسیعی از تکنیک‌ها را برای کشف این سوگیری‌ها توسعه داده‌اند و از ایجاد مدل‌های عادلانه‌تر اطمینان می‌دهند. بیایید چند رویکرد کلیدی در این حوزه را بررسی کنیم.

راهکارهای کاهش سوگیری در بینایی کامپیوتر

با تکیه بر تکنیک‌های تشخیص سوگیری در بینایی کامپیوتر که قبلاً بررسی کردیم، محققان مجموعه داده‌های معیار محبوب را تجزیه و تحلیل می‌کنند تا انواع سوگیری موجود در آن‌ها را شناسایی کنند و از ایجاد مجموعه‌های داده منصفانه‌تر مطمئن شوند. از آنجایی که سوگیری مجموعه داده منجر به سوگیری الگوریتمی می‌شود، استراتژی‌های کاهش معمولاً بر بهترین شیوه‌ها برای ایجاد مجموعه داده و نمونه‌برداری تمرکز می‌کنند. این رویکرد به ما امکان می‌دهد تا یک فرآیند جمع‌آوری داده‌های بصری آگاه از تعصب داشته باشیم تا سوگیری را از پایه مدل‌های بینایی کامپیوتر به حداقل برسانیم. این بخش به تشریح تکنیک‌های کاهش عملی سوگیری می‌پردازد که بر سه حوزه تمرکزی تقسیم می‌شوند:

نتیجه گیری

این مقاله مقدمه‌ای پایه‌ای برای درک تشخیص سوگیری در بینایی کامپیوتر، پوشش انواع سوگیری، روش‌های تشخیص و استراتژی‌های کاهش ارائه می‌کند. همانطور که در بخش‌های قبلی اشاره شد، سوگیری در طول چرخه زندگی داده‌های بصری فراگیر است. تحقیقات بیشتر باید نمایش‌های غنی‌تری از داده‌های بصری، رابطه بین تعصب و هندسه فضای پنهان، و تشخیص سوگیری در ویدیو را بررسی کند. برای کاهش سوگیری، ما به شیوه‌های جمع‌آوری داده عادلانه‌تر و آگاهی بیشتر از سوگیری‌ها در آن مجموعه داده‌ها نیاز داریم.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *