زمان تخمینی مطالعه: 3 دقیقه
نحوه کار هوش مصنوعی مولد با استفاده از مدلهای یادگیری ماشینی است که مدلهای بسیار بزرگی هستند که روی حجم وسیعی از دادهها از قبل آموزش دیدهاند. این نوع هوش مصنوعی از دو دسته اصلی تشکیل شده است :
مدل های بنیادی(Fundamental models)
مدلهای بنیادی (FM) مدلهای یادگیری ماشین هستند که بر روی طیف گستردهای از دادههای تعمیمیافته و بدون برچسب آموزش داده شدهاند. آنها قادر به انجام طیف گستردهای از وظایف عمومی هستند. مدلهای بنیادی نتیجه آخرین پیشرفتها در فناوری هستند که دههها در حال تکامل بودهاند. به طور کلی، یک FM از الگوها و روابط آموخته شده برای پیش بینی مورد بعدی در یک دنباله استفاده میکند.
به عنوان مثال، با تولید تصویر، مدل تصویر را تجزیه و تحلیل کرده و یک نسخه واضح تر از تصویر را ایجاد میکند. به طور مشابه، با متن، مدل کلمه بعدی را در یک رشته متن بر اساس کلمات قبلی و زمینه آنها پیش بینی میکند. سپس با استفاده از تکنیکهای توزیع احتمال، کلمه بعدی را انتخاب میکند.
مدلهای زبان بزرگ(large language models)
مدلهای زبان بزرگ (LLM) یک کلاس از مدلهای بنیادی هستند. برای مثال، مدلهای از پیش آموزشدیده مولدیGPT ساخته شده توسط شرکت OpenAI نمونهای از LLM میباشد. مدلهای زبان بزرگ به طور خاص بر روی وظایف مبتنی بر زبان مانند خلاصه سازی، تولید متن، طبقهبندی، گفتگوی پایان باز و استخراج اطلاعات متمرکز هستند.چیزی که LLM ها را خاص میکند توانایی آنها در انجام وظایف متعدد است. آنها میتوانند این کار را انجام دهند زیرا دارای پارامترهای زیادی هستند که آنها را قادر به یادگیری مفاهیم پیشرفته میکند.
یک LLM مانند GPT-3 میتواند میلیاردها پارامتر را در نظر بگیرد و توانایی تولید محتوا را از ورودیهای بسیار کمی را دارا است. مدلهای زبان بزرگ از طریق قرار گرفتن در معرض پیش آموزش با دادههای مقیاس اینترنت در همه اشکال مختلف و الگوهای بی شمار آن، یاد میگیرند که دانش خود را در طیف گستردهای از زمینهها به کار ببرند.
2 پاسخ
خیلی زیبا و گیرا متشکرم از مطالب باشکوهتون
با تشکر از ابراز احساسات باشکوهتون
تیم پشتیبانی الکتروهایو