متن خبر

این تولید کننده ویدیوی هوش مصنوعی ممکن است تقریباً به سرعت فیلمبرداری واقعی باشد

این تولید کننده ویدیوی هوش مصنوعی ممکن است تقریباً به سرعت فیلمبرداری واقعی باشد

شناسهٔ خبر: 704465 -




باند Gen-3 آلفا توربو
(اعتبار تصویر: Runway/Instagram)

سازنده ویدیوی مبتنی بر هوش مصنوعی Runway اکنون Gen-3 Alpha Turbo را ارائه می دهد که مدل اخیر Gen-3 Alpha را با سرعتی حتی بیشتر از جانشین مدل Gen-2 تقویت می کند. آخرین تکرار ظاهراً هفت برابر سریع‌تر است در حالی که فقط نصف Gen-3 Alpha هزینه دارد، که احتمالاً توجه بسیاری از فیلمسازان حرفه‌ای و آماتور علاقه‌مند به هوش مصنوعی را به خود جلب خواهد کرد.

همانطور که از نام آن پیداست، Gen-3 Alpha Turbo همه چیز در مورد سرعت است. طبق گفته Runway، زمان بین ارسال یک درخواست و دیدن یک ویدیو به تولید تقریباً در زمان واقعی کاهش می یابد. ایده این است که برای صنایعی که چنین سرعتی در آنها بسیار مهم است، مانند محتوای رسانه های اجتماعی و تبلیغات موضوعی، چیزی ارائه دهیم. معامله در کیفیت است. در حالی که Runway اصرار دارد که ویدیوهای مدل توربو اساساً به خوبی Gen-3 Alpha استاندارد هستند، نوع غیر توربو می‌تواند تصاویر با کیفیت بالاتری را برای کلیت ویدیو ایجاد کند.

با این حال، مدل توربو به اندازه‌ای سریع است که کریستوبال والنزولا، مدیرعامل Runway در X به خود می‌بالید که «اکنون تایپ یک جمله بیشتر از تولید ویدیو طول می‌کشد».

سازندگانی که مایلند به جای اینکه منتظر رندر شدن ویدیوها باشند، روی طرح‌ریزی و تولید ویدیوها تمرکز کنند، احتمالاً Gen-3 Alpha Turbo سرعت بیشتری خواهند داشت. وقتی قیمت در این مورد نصف شود، این دو برابر می شود. یک ویدیوی دوم پنج اعتبار هزینه دارد، در مقابل ده اعتبار برای یک ثانیه از یک ویدیوی استاندارد Gen-3 Alpha ساخته شده است. تیتراژ در Runway در بسته‌هایی ارائه می‌شود که از 10 دلار برای 1000 تیتراژ شروع می‌شود، پس تفاوت بین 100 ثانیه فیلم برای 10 دلار یا 200 ثانیه فیلم برای 10 دلار است. علاقه مندان همچنین می توانند مدل جدید را از طریق یک آزمایش رایگان نیز امتحان کنند.

فیلم AI Boom

قیمت گذاری و بهبود عملکرد تهاجمی Runway ML در حالی رخ می دهد که این شرکت با رقابت سختی با سایر مدل های تولید ویدیوی هوش مصنوعی روبرو است. قابل‌توجه‌ترین آنها OpenAI و مدل Sora آن است، اما از تنها مدل بسیار دور است. هوش مصنوعی پایدار ، پیکا، ماشین رویایی آزمایشگاه‌های لوما و موارد دیگر همگی در حال رقابت هستند تا مدل‌های ویدیویی هوش مصنوعی را در معرض دید عموم قرار دهند. حتی شرکت مادر TikTok، Bytedance، یک سازنده ویدئو با هوش مصنوعی به نام Jimeng دارد، اگرچه در حال حاضر به چین محدود شده است.

تمرکز Runway بر روی سرعت و دسترسی با مدل Turbo می تواند به آن کمک کند تا در میدان شلوغ برجسته شود. در مرحله بعد، Runway قصد دارد مدل های خود را با مکانیسم های کنترلی بهتر و احتمالاً حتی تعامل در زمان واقعی تقویت کند. مدل Gen-3 Alpha Turbo بسیاری از خواسته‌های سازنده‌های ویدئویی را که با هوش مصنوعی آزمایش می‌کنند، در خود جای داده است. اما، برای شکست دادن رقبای تبدیل کلمات و تصاویر به ویدئو، باید به طور مداوم ارائه شود.

ارائه یکپارچگی قابل اعتماد در طراحی شخصیت و محیط چیز کوچکی نیست، اما استفاده از یک تصویر اولیه به عنوان نقطه مرجع برای حفظ انسجام در بین عکس‌های مختلف می‌تواند کمک کند. در Gen-3، هوش مصنوعی Runway می تواند یک ویدیوی 10 ثانیه ای ایجاد کند که توسط حرکت یا پیام های متنی اضافی در پلت فرم هدایت می شود. در ویدیوی زیر می توانید نحوه عملکرد آن را مشاهده کنید.

"Gen-3 Alpha Turbo Image to Video اکنون در دسترس است و می تواند 7 برابر سریعتر با نصف قیمت Gen-3 Alpha اصلی تولید کند. همه اینها در حالی که عملکرد در بسیاری از موارد استفاده مشابه است. Turbo برای همه برنامه ها، از جمله آزمایشی به صورت رایگان، در دسترس است. .

ویژگی تصویر به ویدئو Runway فقط تضمین نمی‌کند که افراد و پس‌زمینه‌ها وقتی از فاصله دور دیده می‌شوند ثابت بمانند. Gen-3 همچنین دارای ویژگی همگام سازی لبه Runway است به طوری که فردی که صحبت می کند دهان خود را به گونه ای حرکت می دهد که با کلماتی که می گویند مطابقت داشته باشد. یک کاربر می‌تواند به مدل هوش مصنوعی بگوید که شخصیت او چه چیزی را می‌خواهد بگوید، و این حرکت به گونه‌ای متحرک خواهد شد. ترکیب دیالوگ‌های هماهنگ و حرکات واقعی شخصیت‌ها، بسیاری از توسعه‌دهندگان بازاریابی و تبلیغات را به دنبال راه‌های جدید و، در حالت ایده‌آل، ارزان‌تر برای تولید ویدیو، جلب می‌کند.

بعدی

اضافه کردن به پلتفرم Gen-3 نیز تکمیل نشده است. گام بعدی این است که همان پیشرفت‌ها را در گزینه ویدیو به ویدیو ایجاد کنید. ایده این است که همان حرکت را حفظ کنید اما به سبکی متفاوت. برای مثال، انسانی که در خیابان می دود، تبدیل به یک روباه انسان‌نمای متحرک می‌شود که از میان جنگل می‌دوزد. Runway همچنین آپشن های کنترلی خود را به Gen-3 می‌آورد، مانند Motion Brush، Advanced Camera Controls و Director Mode.

ابزارهای ویدئویی هوش مصنوعی هنوز در مراحل اولیه توسعه هستند و اکثر مدل‌ها در تولید محتوای کوتاه‌مدت برتر هستند اما با روایت‌های طولانی‌تر دست و پنجه نرم می‌کنند. این موضوع Runway و آپشن های جدید آن را از نقطه نظر بازار در یک موقعیت قوی قرار می‌دهد، اما تنها نیست. Midjourney، Ideogram، Leonardo (اکنون متعلق به Canva است)، و دیگران همگی در حال رقابت برای ساختن یک تولید کننده ویدیوی AI قطعی هستند. البته، همه آنها مراقب OpenAI و تولیدکننده ویدیوی Sora آن هستند. OpenAI در میان سایر مزایا، مزایایی در تشخیص نام دارد. در واقع، Toys"R"Us قبلا یک تبلیغ کوتاه با استفاده از Sora ساخته و آن را در جشنواره شیرهای کن به نمایش گذاشته است. با این حال، فیلم درباره تولیدکننده‌های ویدیوی هوش مصنوعی تنها در مرحله اول است و برنده پیروز که در پایان با حرکت آهسته تشویق می‌کند، اجتناب‌ناپذیر نیست. با داغ شدن رقابت، انتشار Gen-3 Alpha توسط Runway یک حرکت استراتژیک برای حفظ موقعیت پیشرو در بازار است.

شما همچنین ممکن است دوست داشته باشید ...

مشارکت کننده

اریک هال شوارتز یک نویسنده مستقل برای TechRadar با بیش از 15 سال تجربه در پوشش تقاطع جهان و فناوری است. در پنج سال گذشته، او به‌عنوان سرپرست برای Voicebot.ai خدمت کرد و در زمینه گزارش‌دهی در زمینه هوش مصنوعی و مدل‌های زبان بزرگ پیشرو بود. او از آن زمان در محصولات مدل‌های هوش مصنوعی مولد، مانند ChatGPT، Anthropic's Claude، Google Gemini، و هر ابزار رسانه مصنوعی دیگر متخصص شد. تجربه او طیف وسیعی از رسانه ها را شامل می شود، از جمله رویدادهای چاپی، دیجیتال، پخش و زنده. اکنون، او همچنان به گفتن داستان‌هایی که مردم می‌خواهند و نیاز دارند درباره فضای به‌سرعت در حال تکامل هوش مصنوعی و تأثیر آن بر زندگی‌شان بشنوند، ادامه می‌دهد. اریک در شهر نیویورک مستقر است.

خبرکاو

ارسال نظر




تبليغات ايهنا تبليغات ايهنا

تمامی حقوق مادی و معنوی این سایت متعلق به خبرکاو است و استفاده از مطالب با ذکر منبع بلامانع است