هوش مصنوعی تولید کننده تصویر گوگل ارتقا یافته است
گوگل در حال ارتقاء فناوری تولید تصویر خود برای همگام با رقبا است.
در کنفرانس توسعهدهندگان I/O این شرکت در Mountain View در روز سهشنبه، گوگل Imagen 3 را معرفی کرد که جدیدترین مدل از خانواده مدلهای هوش مصنوعی مولد Imagen این غول فناوری است.
Demis Hassabis، رئیس DeepMind، بخش تحقیقات هوش مصنوعی گوگل، بيان کرد که Imagen 3 در مقایسه با نسخه قبلی خود، Imagen 2، پیامهای متنی را که به تصاویر ترجمه میشود، دقیقتر درک میکند و در نسلهای خود «خلاقانهتر و دقیقتر» است. او بيان کرد که علاوه بر این، این مدل «مصنوعات منحرف کننده» و خطاهای کمتری تولید می کند.
Hassabis گفت : "این [همچنین] بهترین مدل ما برای رندر متن است که برای مدل های تولید تصویر یک چالش بوده است. "
برای رفع نگرانیها در مورد پتانسیل ایجاد دیپفیک، گوگل او میگوید که Imagen 3 از SynthID استفاده میکند، رویکردی که توسط DeepMind برای اعمال واترمارکهای رمزنگاری نامرئی در رسانهها ایجاد شده است.
ثبت نام برای Imagen 3 در پیش نمایش خصوصی در ابزار ImageFX گوگل در دسترس است و گوگل می گوید که این مدل به زودی برای توسعه دهندگان و مشتریان شرکتی با استفاده از Vertex AI، پلتفرم توسعه هوش مصنوعی شرکتی گوگل ارائه خواهد شد.
گوگل معمولاً اطلاعات زیادی در مورد منبع داده هایی که برای آموزش مدل های هوش مصنوعی خود استفاده می کند فاش نمی کند - و این بار نیز از این قاعده مستثنی نبود. دلیلی برای آن وجود دارد. بسیاری از داده های آموزشی از سایت های عمومی، مخازن و مجموعه داده ها در سراسر وب می آیند. و برخی از این دادههای آموزشی، بهویژه دادههای دارای حق نسخهبرداری که بدون اجازه سازندگان محتوا حذف شدهاند، منبع دعاوی مرتبط با IP هستند.
کنترلهای ناشر وب Google به مدیران وب این امکان را میدهد که از حذف دادهها، از جمله عکسها و ویدیوها، از وبسایتهایشان توسط شرکت جلوگیری کنند. اما گوگل ابزار "انصراف" را ارائه نمی دهد، و - برخلاف برخی از رقبای خود - این شرکت متعهد به پرداخت غرامت به دارندگان حقوق برای مشارکت (در برخی موارد ناآگاهانه) آنها در مجموعه داده های آموزشی نیست.
فقدان شفافیت تعجب آور نیست. اما ناامید کننده است - به ویژه از طرف شرکتی با منابعی مانند Google.
ارسال نظر