زمان تخمینی مطالعه: 6 دقیقه
مدلهای یادگیری ماشین سنتی گسسته بودند یا بر طبقهبندی نقاط داده متمرکز بودند که متفاوت با نحوه کار مدلهای مولد هوش مصنوعی میباشد. آنها سعی کردند رابطه بین عوامل شناخته شده و ناشناخته را تعیین کنند. به عنوان مثال، آنها با بررسی تصاویر دادههای مختلف مانند چینش پیکسلها، خط، رنگ و شکل در تلاش برای نگاشت مفاهیم شناخته شده به مفاهیم ناشناخته هستند. از نظر ریاضی، مدلها با شناسایی معادلاتی کار میکردند که میتوانستند به صورت عددی عوامل ناشناخته و شناختهشده را بهعنوان متغیرهای x و y ترسیم کنند.
مدلهای مولد یک گام جلوتر رفته است. به جای پیشبینی برچسب با برخی ویژگیها، آنها سعی میکنند ویژگیهایی را پیشبینی کنند که برچسب خاصی به آنها داده شده است. از نظر ریاضی، مدلسازی مولد احتمال وقوع x و y را با هم محاسبه میکند. همچنین توزیع ویژگیهای دادههای مختلف و روابط آنها را یاد میگیرد. به عنوان مثال، مدلهای مولد تصاویر حیوانات را تجزیه و تحلیل میکنند تا متغیرهایی مانند شکلهای مختلف گوش، شکل چشم، ویژگیهای دم و الگوهای پوست را ثبت کنند. بر اساس نحوه کار مدلهای مولد در هوش مصنوعی آنها ویژگیها و روابط خود را یاد میگیرند تا بفهمند حیوانات مختلف به طور کلی چگونه به نظر میرسند. سپس میتوانند تصاویر حیوانات جدیدی را که در مجموعه آموزشی نبوده را بازسازی کنند.در ادامه مطلب دستهبندیهای گستردهای از مدلهای هوش مصنوعی مولد را بررسی خواهیم کرد:
مدلهای انتشاری(Diffusion models)
مدلهای انتشاری با ایجاد تغییرات تصادفی کنترلشده مکرر در نمونه دادههای اولیه، دادههای جدیدی ایجاد میکنند. آنها با دادههای اصلی شروع میکنند و تغییرات ظریف (نویز) را اضافه میکنند و به تدریج آن را کمتر شبیه به اصلی میکنند. این نویز به دقت کنترل میشود تا اطمینان حاصل شود که دادههای تولید شده منسجم و واقعی باقی میمانند.
پس از اضافه کردن نویز در چندین تکرار، مدل انتشاری روند را معکوس میکند. حذف نویز معکوس به تدریج نویز را حذف میکند تا نمونه داده جدیدی تولید کند که شبیه نمونه اصلی باشد.
شبکههای متخاصم مولد(Generative adversarial networks)
شبکه متخاصم مولد (GAN) یکی دیگر از مدلهای هوش مصنوعی مولد است که بر اساس مفهوم مدل انتشار است.GAN ها با آموزش دو شبکه عصبی به شیوهای رقابتی کار میکنند. اولین شبکه که به عنوان “مولد” شناخته میشود، نمونههای جعلی داده را با اضافه کردن نویز تصادفی تولید میکند. شبکه دوم که “تمایزگر” نام دارد، سعی میکند بین دادههای واقعی و جعلی تولید شده توسط مولد تمایز قائل شود.
در طول آموزش، مولد به طور مداوم توانایی خود را برای ایجاد دادههای واقعی بهبود میبخشد در حالی که تمایزگر در تشخیص واقعی از جعلی بهتر میشود. این فرآیند خصومتآمیز تا زمانی ادامه مییابد که مولد دادههایی را تولید کند که آنقدر قانعکننده باشد که تمایزگر نتواند آن را از دادههای واقعی تشخیص دهد. GAN ها به طور گستردهای در تولید تصاویر واقعی، انتقال سبک و وظایف تقویت دادهها استفاده میشوند.
رمزگذارهای خودکار متغیر(Variational autoencoders)
رمزگذارهای خودکار متغیر (VAE) نمایش فشردهای از دادهها به نام فضای پنهان(Latent space) را به عنوان نحوه کار مدلهای مولد هوش مصنوعی یاد میگیرند. فضای پنهان یک نمایش ریاضی از دادهها است. درواقع آن را میتوان به عنوان یک کد منحصر به فرد در نظر گرفت که دادهها را بر اساس تمام ویژگیهای آنها نشان میدهد. به عنوان مثال، اگر در حال مطالعه چهرهها هستید، فضای پنهان حاوی اعدادی است که شکل چشم، شکل بینی، استخوان گونه و گوش را نشان میدهد. VAE ها از دو شبکه عصبی به عنوان رمزگذار و رمزگشا استفاده میکنند. شبکه عصبی رمزگذار دادههای ورودی را به یک میانگین و واریانس برای هر بعد از فضای پنهان نگاشت میکند. این یک نمونه تصادفی از توزیع گاوسین (نرمال) تولید میکند. این نمونه یک نقطه در فضای پنهان است و یک نسخه فشرده و ساده شده از دادههای ورودی را نشان میدهد.
شبکه عصبی رمزگشا این نقطه نمونه برداری شده را از فضای پنهان میگیرد و آن را به دادههایی شبیه به ورودی اصلی بازسازی میکند. در این نوع شبکه از توابع ریاضی برای اندازهگیری میزان مطابقت دادههای بازسازی شده با دادههای اصلی استفاده میشود.
مدلهای مبتنی بر تبدیلگر(Transformer-based models)
مدل هوش مصنوعی مولد مبتنی بر تبدیلگر مبتنی بر مفاهیم رمزگذار و رمزگشای VAE است. مدلهای مبتنی بر تبدیلگر لایههای بیشتری به رمزگذار اضافه میکنند تا عملکرد را در کارهای مبتنی بر متن مانند درک مطلب، ترجمه و نوشتن خلاقانه بهبود بخشند. مدلهای مبتنی بر تبدیلگر از مکانیزم خود توجهی استفاده میکنند. آنها اهمیت بخشهای مختلف یک دنباله ورودی را هنگام پردازش هر عنصر در دنباله میسنجند. یکی دیگر از ویژگیهای کلیدی آنها این است که این مدلهای هوش مصنوعی تعبیههای متنی را پیاده سازی میکنند. رمزگذاری یک عنصر دنباله نه تنها به خود عنصر بلکه به زمینه آن در داخل دنباله نیز بستگی دارد.
– نحوه کار مدلهای مبتنی بر تبدیلگر
برای درک نحوه عملکرد مدلهای مبتنی بر تبدیلگر ، یک جمله را به عنوان دنبالهای از کلمات تصور کنید. توجه به خود(Self-attention) به مدل کمک میکند تا هنگام پردازش هر کلمه روی کلمات مرتبط تمرکز کند. برای ثبت انواع مختلف روابط بین کلمات، مدل مولد مبتنی بر تبدیلگر از لایههای رمزگذار متعددی به نام سرهای توجه استفاده میکند. هر سر یاد میگیرد که به بخشهای مختلف توالی ورودی توجه کند. این به مدل اجازه میدهد تا به طور همزمان جنبههای مختلف داده را در نظر بگیرد.
هر لایه همچنین تعبیههای متنی را اصلاح میکند. لایهها جاسازیها را آموزندهتر میکنند و همه چیز را از نحو دستوری گرفته تا معانی مفهومی پیچیده را در بر میگیرند.