زمان تخمینی مطالعه: 3 دقیقه
شرکت OpenAI در حال راه اندازی یک مدل جدید برای تولید ویدئو است که Sora نام دارد. این شرکت میگوید که هوش مصنوعی Sora «میتواند صحنههای واقعی و تخیلی را از دستورالعملهای متنی خلق کند». مدل متن به ویدیو به کاربران اجازه میدهد تا ویدیوهای واقعگرایانه را تا یک دقیقه ایجاد کنند. تمامی محتوای تولید شده در این مدل بر اساس متنهایی که توسط کاربران نوشتهاند.
بر اساس پست وبلاگ OpenAI، مدل هوش مصنوعی Sora قادر است “صحنههای پیچیده با شخصیتهای متعدد، انواع حرکت خاص، و جزئیات دقیق سوژه و پس زمینه را ایجاد کند.” این شرکت همچنین خاطرنشان میکند که این مدل میتواند درک کند که چگونه اجسام «در دنیای فیزیکی وجود دارند»، و همچنین «بهطور دقیق اشیاء را تفسیر میکند و شخصیتهای قانعکنندهای ایجاد میکند که احساسات پر جنب و جوش را بیان میکنند».
این مدل همچنین میتواند یک ویدیو بر اساس یک تصویر ثابت تولید کند، همچنین فریمهای از دست رفته را در یک ویدیوی موجود پر کرده و یا قادر است آن را گسترش دهد. دموهای تولید شده توسط Sora که در پست وبلاگ OpenAI گنجانده شده است، شامل صحنهای هوایی از کالیفرنیا است. ویدئویی که به نظر میرسد از داخل قطار توکیو گرفته شده است. بسیاری از این ویدیوها نشانههای آشکاری از ردپای هوش مصنوعی را دارند مانند یک طبقه متحرک مشکوک در یک ویدیو از یک موزه که کاملا قابل مشاهده است. OpenAI میگوید که این مدل «ممکن است با شبیهسازی دقیق فیزیک یک صحنه پیچیده مشکل داشته باشد»، اما نتایج حاصله در کل بسیار چشمگیر هستند.
چند سال پیش، مولدهای متن به تصویر اصلی مدلهایی مانند Midjourney بودند که در خط مقدم برای تبدیل کلمات به تصویر بودند. اما اخیراً، مدلهای مولد ویدیو با سرعت قابل توجهی شروع به بهبود کرده است: شرکتهایی مانند Runway و Pika مدلهای متن به ویدیوی چشمگیر خود را نشان دادهاند و چهرههای Lumiere گوگل نیز یکی از رقبای اصلی OpenAI در این فضا هستند. مشابه Sora، Lumiere ابزارهای تبدیل متن به ویدیو را در اختیار کاربران قرار میدهد و همچنین به آنها اجازه میدهد از یک تصویر ثابت فیلم بسازند.
مدل هوش مصنوعی Sora در حال حاضر فقط برای “red teamers” که در حال ارزیابی مدل از نظر آسیبها و خطرات احتمالی هستند در دسترس است. OpenAI همچنین دسترسی به برخی از هنرمندان تجسمی، طراحان و فیلمسازان را برای دریافت بازخورد ارائه میدهد.