زمان تخمینی مطالعه: 3 دقیقه

نحوه کار هوش مصنوعی مولد با استفاده از مدل‌های یادگیری ماشینی است که مدل‌های بسیار بزرگی هستند که روی حجم وسیعی از داده‌ها از قبل آموزش دیده‌اند. این نوع هوش مصنوعی از دو دسته اصلی تشکیل شده است :

مدل های بنیادی(Fundamental models)

مدل‌های بنیادی (FM) مدل‌های یادگیری ماشین هستند که بر روی طیف گسترده‌ای از داده‌های تعمیم‌یافته و بدون برچسب آموزش داده شده‌اند. آنها قادر به انجام طیف گسترده‌ای از وظایف عمومی هستند. مدل‌های بنیادی نتیجه آخرین پیشرفت‌ها در فناوری هستند که دهه‌ها در حال تکامل بوده‌اند. به طور کلی، یک FM از الگوها و روابط آموخته شده برای پیش بینی مورد بعدی در یک دنباله استفاده می‌کند.

به عنوان مثال، با تولید تصویر، مدل تصویر را تجزیه و تحلیل کرده و یک نسخه واضح تر از تصویر را ایجاد می‌کند. به طور مشابه، با متن، مدل کلمه بعدی را در یک رشته متن بر اساس کلمات قبلی و زمینه آنها پیش بینی می‌کند. سپس با استفاده از تکنیک‌های توزیع احتمال، کلمه بعدی را انتخاب می‌کند.

مدل‌های زبان‌ بزرگ(large language models)

مدل‌های‌ زبان بزرگ (LLM) یک کلاس از مدل‌های بنیادی هستند. برای مثال، مدل‌های از پیش آموزش‌دیده مولدیGPT ساخته شده توسط شرکت OpenAI نمونه‌ای از LLM می‌باشد. مدل‌های زبان بزرگ به طور خاص بر روی وظایف مبتنی بر زبان مانند خلاصه سازی، تولید متن، طبقه‌بندی، گفتگوی پایان باز و استخراج اطلاعات متمرکز هستند.چیزی که LLM ها را خاص می‌کند توانایی آنها در انجام وظایف متعدد است. آنها می‌توانند این کار را انجام دهند زیرا دارای پارامترهای زیادی هستند که آنها را قادر به یادگیری مفاهیم پیشرفته می‌کند.

LLM ها در الکتروهایو
LLM ها در الکتروهایو

یک LLM مانند GPT-3 می‌تواند میلیاردها پارامتر را در نظر بگیرد و توانایی تولید محتوا را از ورودی‌های بسیار کمی را دارا است. مدل‌های زبان بزرگ از طریق قرار گرفتن در معرض پیش آموزش با داده‌های مقیاس اینترنت در همه اشکال مختلف و الگوهای بی شمار آن، یاد می‌گیرند که دانش خود را در طیف گسترده‌ای از زمینه‌ها به کار ببرند.

2 پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *