سایت خبرکاو

جستجوگر هوشمند اخبار و مطالب فناوری

مدل جدید متن به ویدئوی سورای OpenAI می‌تواند محتوای تکان‌دهنده‌ای واقعی ایجاد کند

(اعتبار تصویر: OpenAI) OpenAI با معرفی اولین مدل تبدیل متن به ویدئو خود به نام Sora که قادر به ایجاد محتوای تکان دهنده واقع گرایانه است، زمینه جدیدی را ایجاد می کند. ما در تعجب بودیم که بالاخره چه زمانی این شرکت قصد داشت موتور ویدیویی خود را منتشر کند زیرا بسیاری از رقبای آن، از هوش مصنوعی پایدار گرفته تا گوگل ، آنها را تا حد زیادی شکست داده‌اند. شاید OpenAI می‌خواست همه چیز را ...
توله سگ ساخته شده توسط OpenAI's Sora
(اعتبار تصویر: OpenAI)

OpenAI با معرفی اولین مدل تبدیل متن به ویدئو خود به نام Sora که قادر به ایجاد محتوای تکان دهنده واقع گرایانه است، زمینه جدیدی را ایجاد می کند.

ما در تعجب بودیم که بالاخره چه زمانی این شرکت قصد داشت موتور ویدیویی خود را منتشر کند زیرا بسیاری از رقبای آن، از هوش مصنوعی پایدار گرفته تا گوگل ، آنها را تا حد زیادی شکست داده‌اند. شاید OpenAI می‌خواست همه چیز را درست قبل از راه‌اندازی مناسب به دست آورد. با این سرعت، کیفیت خروجی‌های آن می‌تواند محصولات معاصر خود را تحت الشعاع قرار دهد. با توجه به صفحه رسمی ، سورا می تواند "صحنه های واقع گرایانه و تخیلی" را از یک پیام متنی تولید کند. بسیار شبیه سایر مدل های هوش مصنوعی متن به ویدئو. تفاوت این موتور در تکنولوژی پشت آن است.

محتوای واقعی

هوش مصنوعی باز ادعا می کند که هوش مصنوعی آن می تواند درک کند که افراد و اشیاء چگونه در دنیای فیزیکی وجود دارند. این به Sora این توانایی را می‌دهد که صحنه‌هایی با افراد متعدد، انواع مختلف حرکات، حالات چهره، بافت‌ها و اشیاء با جزئیات زیاد ایجاد کند. ویدیوهای تولید شده فاقد ظاهر پلاستیکی یا اشکال کابوس‌واری هستند که در سایر محتوای هوش مصنوعی دیده می‌شود - در بیشتر موارد، اما در ادامه به آن بیشتر خواهیم پرداخت.

سورا نیز چند ماژولار است. طبق گزارش ها، کاربران می توانند یک تصویر ثابت را برای استفاده به عنوان پایه یک ویدیو آپلود کنند. محتوای داخل تصویر با توجه زیادی به جزئیات کوچک متحرک می شود. حتی می‌تواند یک ویدیوی از قبل موجود را بگیرد و آن را گسترش دهد یا فریم‌های از دست رفته را پر کند.

درخواست: یک بستر توله سگ های گلدن رتریور که در برف بازی می کنند. سرشان از برف بیرون می‌زند. pic.twitter.com/G1qhJRV9tg 15 فوریه 2024

می‌توانید کلیپ‌های نمونه را در وب‌سایت OpenAI و X (پلتفرمی که قبلاً توییتر نامیده می‌شد) پیدا کنید. یکی از موارد مورد علاقه ما شامل گروهی از توله سگ ها است که در برف بازی می کنند. اگر دقت کنید، می‌توانید خز و برف روی خرطوم‌هایشان را ببینید که کیفیت فوق‌العاده‌ای برایشان دارد. یک کلیپ عالی دیگر یک کبوتر تاجدار ویکتوریا را نشان می‌دهد که مانند یک پرنده واقعی به اطراف می‌چرخد.

کاری در حال پیشرفت

هر چقدر هم که این دو ویدیو تاثیرگذار باشند، سورا کامل نیست. OpenAI اعتراف می کند که "مدل آن دارای نقاط ضعفی است. " می‌تواند برای شبیه‌سازی فیزیک یک شی مشکل داشته باشد، چپ از راست را اشتباه بگیرد، و همچنین «نمونه‌های علت و معلول» را به اشتباه درک کند. شما می توانید یک کاراکتر هوش مصنوعی در یک کوکی گاز بگیرد، اما کوکی فاقد علامت نیش است.

خطاهای عجیب و غریب زیادی نیز ایجاد می کند. یکی از بدبختی‌های خنده‌دارتر شامل گروهی از باستان‌شناسان است که یک تکه کاغذ بزرگ را بیرون می‌آورند که سپس به صندلی تبدیل می‌شود و به یک تکه پلاستیکی مچاله تبدیل می‌شود. به نظر می رسد هوش مصنوعی با کلمات نیز مشکل دارد. "Otter" به اشتباه "Oter" نوشته شده است و "Land Rover" اکنون "Danover" است.

در حرکت رو به جلو، این شرکت با "تیم های قرمز" خود که گروهی از متخصصان صنعت هستند کار خواهد کرد تا "مناطق مهم را از نظر آسیب ها یا خطرات ارزیابی کنند." آن‌ها می‌خواهند مطمئن شوند که سورا اطلاعات نادرست، محتوای نفرت‌انگیز تولید نمی‌کند یا سوگیری ندارد. علاوه بر این، OpenAI قصد دارد یک طبقه‌بندی متن را برای رد درخواست‌هایی که خط‌مشی آنها را نقض می‌کنند، پیاده‌سازی کند. اینها شامل ورودی‌های درخواست محتوای جنسی، ویدیوهای خشونت‌آمیز، و شباهت‌های افراد مشهور در میان چیزهای دیگر است.

هیچ اطلاعاتی در مورد زمان عرضه رسمی Sora وجود ندارد. ما برای کسب اطلاعات در مورد انتشار تماس گرفتیم. این داستان متعاقبا آپدیت خواهد شد. در همین حال، فهرست TechRadar از بهترین ویرایشگرهای ویدیویی هوش مصنوعی برای سال 2024 را تحلیل کنید.

شما هم ممکن است دوست داشته باشید

مشارکت کننده

سزار کادناس چندین سال است که در مورد صنعت فناوری می نویسد و در زمینه لوازم الکترونیکی مصرفی، دستگاه های سرگرمی، ویندوز و صنعت بازی تخصص دارد. اما او همچنین علاقه زیادی به گوشی‌های هوشمند، پردازنده‌های گرافیکی و امنیت سایبری دارد.

خبرکاو