زمان تخمینی مطالعه: 6 دقیقه

مدل‌های یادگیری ماشین سنتی گسسته بودند یا بر طبقه‌بندی نقاط داده متمرکز بودند که متفاوت با نحوه کار مدل‌های مولد هوش مصنوعی می‌باشد. آنها سعی کردند رابطه بین عوامل شناخته شده و ناشناخته را تعیین کنند. به عنوان مثال، آنها با بررسی تصاویر داده‌های  مختلف مانند چینش پیکسل‌ها، خط، رنگ و شکل در تلاش برای نگاشت مفاهیم شناخته شده به مفاهیم ناشناخته هستند. از نظر ریاضی، مدل‌ها با شناسایی معادلاتی کار می‌کردند که می‌توانستند به صورت عددی عوامل ناشناخته و شناخته‌شده را به‌عنوان متغیرهای x و y ترسیم کنند.

مدل‌های مولد یک گام جلوتر رفته است. به جای پیش‌بینی برچسب با برخی ویژگی‌ها، آنها سعی می‌کنند ویژگی‌هایی را پیش‌بینی کنند که برچسب خاصی به آنها داده شده است. از نظر ریاضی، مدل‌سازی مولد احتمال وقوع x و y را با هم محاسبه می‌کند. همچنین توزیع ویژگی‌های داده‌های مختلف و روابط آنها را یاد می‌گیرد. به عنوان مثال، مدل‌های مولد تصاویر حیوانات را تجزیه و تحلیل می‌کنند تا متغیرهایی مانند شکل‌های مختلف گوش، شکل چشم، ویژگی‌های دم و الگوهای پوست را ثبت کنند. بر اساس نحوه کار مدل‌های مولد در هوش مصنوعی آنها ویژگی‌ها و روابط خود را یاد می‌گیرند تا بفهمند حیوانات مختلف به طور کلی چگونه به نظر می‌رسند. سپس می‌توانند تصاویر حیوانات جدیدی را که در مجموعه آموزشی نبوده را بازسازی کنند.در ادامه مطلب دسته‌بندی‌های گسترده‌ای از مدل‌های هوش مصنوعی مولد را بررسی خواهیم کرد:

مدل‌های انتشاری(Diffusion models)

مدل‌های انتشاری با ایجاد تغییرات تصادفی کنترل‌شده مکرر در نمونه داده‌های اولیه، داده‌های جدیدی ایجاد می‌کنند. آنها با داده‌های اصلی شروع می‌کنند و تغییرات ظریف (نویز) را اضافه می‌کنند و به تدریج آن را کمتر شبیه به اصلی می‌کنند. این نویز به دقت کنترل می‌شود تا اطمینان حاصل شود که داده‌های تولید شده منسجم و واقعی باقی می‌مانند.

نحوه کار مدل‌های مولد در هوش مصنوعی

پس از اضافه کردن نویز در چندین تکرار، مدل انتشاری روند را معکوس می‌کند. حذف نویز معکوس به تدریج نویز را حذف می‌کند تا نمونه داده جدیدی تولید کند که شبیه نمونه اصلی باشد.

شبکه‌های متخاصم مولد(Generative adversarial networks)

شبکه متخاصم مولد (GAN) یکی دیگر از مدل‌های هوش مصنوعی مولد است که بر اساس مفهوم مدل انتشار است.GAN ها با آموزش دو شبکه عصبی به شیوه‌ای رقابتی کار می‌کنند. اولین شبکه که به عنوان “مولد” شناخته می‌شود، نمونه‌های جعلی داده را با اضافه کردن نویز تصادفی تولید می‌کند. شبکه دوم که “تمایزگر” نام دارد، سعی می‌کند بین داده‌های واقعی و جعلی تولید شده توسط مولد تمایز قائل شود.

در طول آموزش، مولد به طور مداوم توانایی خود را برای ایجاد داده‌های واقعی بهبود می‌بخشد در حالی که تمایزگر در تشخیص واقعی از جعلی بهتر می‌شود. این فرآیند خصومت‌آمیز تا زمانی ادامه می‌یابد که مولد داده‌هایی را تولید کند که آنقدر قانع‌کننده باشد که تمایز‌گر نتواند آن را از داده‌های واقعی تشخیص دهد. GAN ها به طور گسترده‌ای در تولید تصاویر واقعی، انتقال سبک و وظایف تقویت داده‌ها استفاده می‌شوند.

رمزگذارهای خودکار متغیر(Variational autoencoders)

رمزگذارهای خودکار متغیر (VAE) نمایش فشرده‌ای از داده‌ها به نام فضای پنهان(Latent space) را به عنوان نحوه کار مدل‌های مولد هوش مصنوعی یاد می‌گیرند. فضای پنهان یک نمایش ریاضی از داده‌ها است. درواقع آن را می‌توان به عنوان یک کد منحصر به فرد در نظر گرفت که داده‌ها را بر اساس تمام ویژگی‌های آنها نشان می‌دهد. به عنوان مثال، اگر در حال مطالعه چهره‌ها هستید، فضای پنهان حاوی اعدادی است که شکل چشم، شکل بینی، استخوان گونه و گوش را نشان می‌دهد. VAE ها از دو شبکه عصبی به عنوان رمزگذار و رمزگشا استفاده می‌کنند. شبکه عصبی رمزگذار داده‌های ورودی را به یک میانگین و واریانس برای هر بعد از فضای پنهان نگاشت می‌کند. این یک نمونه تصادفی از توزیع گاوسین (نرمال) تولید می‌کند. این نمونه یک نقطه در فضای پنهان است و یک نسخه فشرده و ساده شده از داده‌های ورودی را نشان می‌دهد.

رمزگذارهای خودکار متغیر(Variational autoencoders) در الکتروهایو

شبکه عصبی رمزگشا این نقطه نمونه برداری شده را از فضای پنهان می‌گیرد و آن را به داده‌هایی شبیه به ورودی اصلی بازسازی می‌کند. در این نوع شبکه از توابع ریاضی برای اندازه‌گیری میزان مطابقت داده‌های بازسازی شده با داده‌های اصلی استفاده می‌شود.

مدل‌های مبتنی بر تبدیل‌گر(Transformer-based models)

مدل هوش مصنوعی مولد مبتنی بر تبدیل‌گر مبتنی بر مفاهیم رمزگذار و رمزگشای VAE است. مدل‌های مبتنی بر تبدیل‌گر لایه‌های بیشتری به رمزگذار اضافه می‌کنند تا عملکرد را در کارهای مبتنی بر متن مانند درک مطلب، ترجمه و نوشتن خلاقانه بهبود بخشند. مدلهای مبتنی بر تبدیل‌گر از مکانیزم خود توجهی استفاده می‌کنند. آنها اهمیت بخش‌های مختلف یک دنباله ورودی را هنگام پردازش هر عنصر در دنباله می‌سنجند. یکی دیگر از ویژگی‌های کلیدی آنها این است که این مدل‎های هوش مصنوعی تعبیه‌های متنی را پیاده سازی می‌کنند. رمزگذاری یک عنصر دنباله نه تنها به خود عنصر بلکه به زمینه آن در داخل دنباله نیز بستگی دارد.

نحوه کار مدل‌های مبتنی بر تبدیل‌گر

برای درک نحوه عملکرد مدل‌های مبتنی بر تبدیل‌گر ، یک جمله را به عنوان دنباله‌ای از کلمات تصور کنید. توجه به خود(Self-attention) به مدل کمک می‌کند تا هنگام پردازش هر کلمه روی کلمات مرتبط تمرکز کند. برای ثبت انواع مختلف روابط بین کلمات، مدل مولد مبتنی بر تبدیل‌گر از لایه‌های رمزگذار متعددی به نام سرهای توجه استفاده می‌کند. هر سر یاد می‌گیرد که به بخش‌های مختلف توالی ورودی توجه کند. این به مدل اجازه می‌دهد تا به طور همزمان جنبه‌های مختلف داده را در نظر بگیرد.

هر لایه همچنین تعبیه‌های متنی را اصلاح می‌کند. لایه‌ها جاسازی‌ها را آموزنده‌تر می‌کنند و همه چیز را از نحو دستوری گرفته تا معانی مفهومی پیچیده را در بر می‌گیرند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *