زمان تخمینی مطالعه: 3 دقیقه

شرکت OpenAI در حال راه اندازی یک مدل جدید برای تولید ویدئو است که Sora نام دارد. این شرکت می‌گوید که هوش مصنوعی Sora «می‌تواند صحنه‌های واقعی و تخیلی را از دستورالعمل‌های متنی خلق کند». مدل متن به ویدیو به کاربران اجازه می‌دهد تا ویدیوهای واقع‌گرایانه را تا یک دقیقه ایجاد کنند. تمامی محتوای تولید شده در این مدل بر اساس متن‌هایی که توسط کاربران نوشته‌اند.

بر اساس پست وبلاگ OpenAI، مدل هوش مصنوعی Sora قادر است “صحنه‌های پیچیده با شخصیت‌های متعدد، انواع حرکت خاص، و جزئیات دقیق سوژه و پس زمینه را ایجاد کند.” این شرکت همچنین خاطرنشان می‌کند که این مدل می‌تواند درک کند که چگونه اجسام «در دنیای فیزیکی وجود دارند»، و همچنین «به‌طور دقیق اشیاء را تفسیر می‌کند و شخصیت‌های قانع‌کننده‌ای ایجاد می‌کند که احساسات پر جنب و جوش را بیان می‌کنند».

این مدل همچنین می‌تواند یک ویدیو بر اساس یک تصویر ثابت تولید کند، همچنین فریم‌های از دست رفته را در یک ویدیوی موجود پر کرده و یا قادر است آن را گسترش دهد. دموهای تولید شده توسط Sora که در پست وبلاگ OpenAI گنجانده شده است، شامل صحنه‌ای هوایی از کالیفرنیا است. ویدئویی که به نظر می‌رسد از داخل قطار توکیو گرفته شده است. بسیاری از این ویدیوها نشانه‌های آشکاری از ردپای هوش مصنوعی را دارند مانند یک طبقه متحرک مشکوک در یک ویدیو از یک موزه که کاملا قابل مشاهده است. OpenAI می‌گوید که این مدل «ممکن است با شبیه‌سازی دقیق فیزیک یک صحنه پیچیده مشکل داشته باشد»، اما نتایج حاصله در کل بسیار چشمگیر هستند.

چند سال پیش، مولدهای متن به تصویر اصلی مدلهایی مانند Midjourney بودند که در خط مقدم برای تبدیل کلمات به تصویر بودند. اما اخیراً، مدل‌های مولد ویدیو با سرعت قابل توجهی شروع به بهبود کرده است: شرکت‌هایی مانند Runway و Pika مدل‌های متن به ویدیوی چشمگیر خود را نشان داده‌اند و چهره‌های Lumiere گوگل نیز یکی از رقبای اصلی OpenAI در این فضا هستند. مشابه Sora، Lumiere ابزارهای تبدیل متن به ویدیو را در اختیار کاربران قرار می‌دهد و همچنین به آنها اجازه می‌دهد از یک تصویر ثابت فیلم بسازند.

مدل هوش مصنوعی Sora در حال حاضر فقط برای “red teamers” که در حال ارزیابی مدل از نظر آسیب‌ها و خطرات احتمالی هستند در دسترس است. OpenAI همچنین دسترسی به برخی از هنرمندان تجسمی، طراحان و فیلمسازان را برای دریافت بازخورد ارائه می‌دهد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *