رقابت در تولید ویدئو با هوش مصنوعی با پرده برداری از Haiper توسط آلوم های Deepmind داغ می شود
تولید ویدیوی مبتنی بر هوش مصنوعی بازار داغی است که در پشت مدل Sora که ماه گذشته منتشر شد OpenAI است. دو دانش آموخته Deepmind، Yishu Miao و Ziyu Wang، ابزار تولید ویدیوی خود Haiper را با مدل هوش مصنوعی خود در زیر آن به طور عمومی منتشر کردند.
میائو که قبلاً در TikTok در تیم اعتماد و ایمنی جهانی کار می کرد و وانگ که به عنوان دانشمند پژوهشی برای Deepmind و Google کار کرده است در سال 2021 کار بر روی این شرکت را آغاز کردند و در سال 2022 آن را به طور رسمی ثبت کردند.
این زوج در یادگیری ماشین تخصص دارند و شروع به کار روی مشکل بازسازی سه بعدی با استفاده از شبکه های عصبی کردند. پس از آموزش در مورد داده های ویدئویی، Miao طی تماسی با TechCrunch بيان کرد که آنها متوجه شدند که تولید ویدئو مشکلی جذاب تر از بازسازی سه بعدی است. به همین دلیل است که هایپر تقریباً شش ماه پیش روی تولید ویدیو تمرکز کرد.
هایپر 13.8 میلیون دلار در یک دور اولیه به رهبری Octopus Ventures با مشارکت 5Y Capital جمع آوری کرده است. قبل از آن، فرشتگان دوست دارند جفری هینتون و Nando de Freitas به این شرکت کمک کرد تا در آوریل 2022 مبلغ 5.4 میلیون دلاری را جمع آوری کند.
سرویس تولید ویدئو
کاربران می توانند به سایت Haiper رفته و با تایپ پیام های متنی شروع به تولید رایگان فیلم کنند. با این حال، محدودیت های خاصی وجود دارد. شما فقط می توانید یک ویدیوی HD طولانی دو ثانیه و یک ویدیو با کیفیت کمی پایین تر تا چهار ثانیه تولید کنید.
این سایت همچنین دارای ویژگی هایی مانند متحرک سازی تصویر شما و رنگ آمیزی مجدد ویدیوی شما به سبکی متفاوت است. به علاوه، این شرکت در تلاش است تا قابلیتهایی مانند قابلیت گسترش ویدیو را معرفی کند.
Miao بيان کرد که این شرکت قصد دارد این ویژگی ها را رایگان نگه دارد تا یک جامعه ایجاد کند. او بيان کرد که در سفر استارتآپ «خیلی زود» است که به فکر ساختن یک محصول اشتراکی پیرامون تولید ویدیو باشیم. با این حال، برای تحلیل موارد استفاده تجاری با شرکت هایی مانند JD.com همکاری کرده است.
ما از یکی از دستورهای اولیه سورا برای تولید یک ویدیوی نمونه استفاده کردیم: «چند ماموت غول پیکر پشمی در حال قدم زدن در میان یک علفزار برفی هستند، خز پشمی بلندشان هنگام راه رفتن به آرامی در باد می وزد، درختان پوشیده از برف و کوه های پوشیده از برف دراماتیک در فاصله، نور اواسط بعد از ظهر با ابرهای تند و خورشید در بلندی در فاصله، درخششی گرم ایجاد میکند، نمای کم دوربین خیرهکننده است که پستاندار پشمالوی بزرگ را با عکاسی زیبا، عمق میدان ثبت میکند.
ساخت یک مدل ویدیوی اصلی
در حالی که هایپر در حال حاضر بر روی وب سایت مشتری خود تمرکز کرده است، می خواهد یک مدل اصلی تولید ویدیو بسازد که می تواند به دیگران ارائه شود. این شرکت هیچ جزئیاتی در مورد این مدل منتشر نکرده است.
Miao بيان کرد که به طور خصوصی با تعدادی از توسعه دهندگان تماس گرفته است تا API بسته خود را امتحان کنند. او انتظار دارد که بازخورد توسعه دهندگان با تکرار سریع مدل توسط شرکت بسیار مهم باشد. هایپر همچنین به فکر عرضه متنباز مدلهای خود بوده است تا به افراد اجازه دهد موارد استفاده مختلف را کشف کنند.
مدیرعامل بر این باور است که در حال حاضر، حل مشکل دره غیرعادی - پدیدهای که با دیدن چهرههای انسانمانند تولید شده توسط هوش مصنوعی - در تولید ویدیو، احساسات وهمآوری را برمیانگیزد، مهم است.
او گفت: «ما در زمینه حل مشکلات در زمینه محتوا و سبک کار نمیکنیم، اما سعی میکنیم روی مسائل اساسی مانند ظاهر انسانهای تولیدشده با هوش مصنوعی در هنگام راه رفتن یا بارش برف کار کنیم.»
این شرکت در حال حاضر حدود 20 کارمند دارد و به طور فعال برای چندین نقش در مهندسی و بازاریابی استخدام می کند.
رقابت در پیش است
Sora اخیراً منتشر شده از OpenAI احتمالاً محبوب ترین رقیب Haiper در حال حاضر است. با این حال، بازیکنان دیگری مانند گوگل و Runway با پشتیبانی انویدیا وجود دارند که بیش از 230 میلیون دلار سرمایه جمع آوری کرده اند. گوگل و متا نیز مدل های تولید ویدئوی خود را دارند. سال گذشته، هوش مصنوعی پایداری مدل Stable Diffusion Video را در پیش نمایش تحقیقاتی معرفی کرد.
ربکا هانت، شریک Octopus Venture معتقد است که در سه سال آینده، هایپر باید یک مدل تولید ویدیو قوی بسازد تا در این بازار متمایز شود.
«به طور واقع بینانه فقط تعداد انگشت شماری از افراد برای دستیابی به این هدف قرار دارند. این یکی از دلایلی است که ما می خواستیم از تیم هایپر حمایت کنیم. زمانی که مدلها به نقطهای برسند که از دره عجیب و غریب فراتر میرود و دنیای واقعی و تمام فیزیک آن را منعکس میکند، دورهای پیش میآید که برنامهها بینهایت هستند.» او از طریق ایمیل به TechCrunch گفت.
در حالی که سرمایهگذاران به دنبال سرمایهگذاری در استارتآپهای تولید ویدیو با هوش مصنوعی هستند، آنها همچنین فکر میکنند که این فناوری هنوز جای پیشرفت زیادی دارد.
«به نظر میرسد ویدیوی هوش مصنوعی در سطح GPT-2 است. ما در سال گذشته گامهای بزرگی برداشتهایم، اما هنوز راه زیادی برای استفاده روزانه از این محصولات وجود دارد. چه زمانی «لحظه ChatGPT» برای ویدیو فرا می رسد؟ جاستین مور از a16z سال گذشته نوشت.
ارسال نظر