گوگل به تازگی پاسخ خود را به Midjourney ارائه کرده است – در اینجا نحوه آزمایش مولد تصویر هوش مصنوعی آورده شده است

شناسهٔ خبر: 699756 - تاریخ: آگوست 16, 2024

(اعتبار تصویر: گوگل)

بهترین تولیدکننده‌های تصویر هوش مصنوعی اخیراً در اخبار بوده‌اند، اما نه همیشه به دلایل درست - با هوش مصنوعی Grok-2 ایلان ماسک که انواع بحث‌ها را بر سر عدم وجود نرده‌های محافظ ایجاد می‌کند. گوگل احتمالاً می‌خواهد گفتگو را در جهت مثبت‌تری تغییر دهد، زیرا این شرکت به تازگی دسترسی به ژنراتور Imagen 3 خود را برای همه در ایالات متحده گسترش داده است و به طور گسترده افرادی را که می‌توانند از ابزار هوش مصنوعی استفاده کنند، افزایش داده است.

مقاله تحقیقاتی همراه گوگل، Imagen 3 را به عنوان "مدل انتشار نهفته ای که تصاویر با کیفیت بالا را از پیام های متنی تولید می کند" توصیف می کند و مقاله اضافه می کند که "Imagen 3 در زمان ارزیابی بر سایر مدل های پیشرفته ترجیح داده می شود." می‌توان از آن برای جمع‌آوری تصاویر بر اساس متن وارد شده توسط کاربر، با محدودیت‌هایی در مورد محتوای توهین‌آمیز یا غیرقانونی استفاده کرد که آن را به رقیب جایگزین‌های محبوبی مانند Midjourney تبدیل می‌کند.

این ابزار ابتدا در ماه می 2024 در رویداد Google I/O راه اندازی شد، اما در آن زمان به کاربران منتخب Vertex AI گوگل محدود می شد. اکنون، هر کسی در ایالات متحده می‌تواند در صورت تمایل آن را امتحان کند، که نشان می‌دهد گوگل به توانایی ابزار خود برای ایجاد تصاویر قابل اعتماد و اجتناب از برخی از مشکلاتی که برای مدت طولانی تولیدکننده‌های تصویر هوش مصنوعی را درگیر کرده است، بسیار مطمئن‌تر است.

به نظر می رسد تاکنون واکنش ها نسبت به Imagen 3 متفاوت بوده است. چندین کاربر متوجه شده اند که به نظر می رسد نسبت به درخواست های کاربر بسیار حساس تر از قبل است و کلماتی را که ممکن است در Imagen 2 مسدود نشده باشند سانسور می کند.

به عنوان مثال، یکی از کاربران در Reddit گفت: "واقعاً باید برای رسیدن به آنچه قبلاً به دست می آوردم کار اضافی انجام دهم و یک کلمه تصادفی مانند "جوراب" یا "آب" فیلتر سانسور را فعال می کند که به کلمات بدخیم بسیار حساس تر است. ” برای دیگری ، Imagen 3 از ترسیم ایده‌های بی‌گناه مانند سایبورگ یا مردی که دستانش را روی هم می‌گذارد، خودداری کرد. با این حال، نکات مثبتی وجود دارد که یکی از کاربران فوق‌الذکر به خروجی با کیفیت بالا و «تشخیص بافت و کلمه شگفت‌انگیز» اشاره کرده است.

چگونه Imagen 3 را امتحان کنیم

اگر می‌خواهید Imagen 3 را برای چرخش انتخاب کنید، ابتدا باید در ایالات متحده مستقر باشید تا دسترسی داشته باشید. اگر هستید، می توانید به وب سایت AI Test Kitchen گوگل بروید و با حساب Google خود وارد شوید. پس از انجام این کار، باید بتوانید از مدل جدید تولید تصویر استفاده کنید.

گزارش‌های کاربران مبنی بر اینکه Imagen 3 محدودتر از نسخه قبلی خود است، یک تصویر مفید از وضعیت فعلی تولیدکننده‌های تصویر هوش مصنوعی است. در ماه‌های اخیر جنجال‌های زیادی توسط این ابزارها ایجاد شده است و گاهی اوقات به نظر می‌رسد هفته‌ای نمی‌گذرد که برخی از تصاویر تولید شده توسط هوش مصنوعی احساسات اینترنت را تحریک نکند.

آخرین مقصر، هوش مصنوعی Grok-2 ایلان ماسک بوده است. این ابزار - که محدود به کاربران ممتاز X (توئیتر سابق) است، به‌تازگی به نسخه دوم خود به‌روزرسانی شد و تصاویر را با استفاده از منبع باز Flux تولید می‌کند. کاربران دریافتند که محدودیت‌های بسیار کمی در مورد آنچه که می‌توان ایجاد کرد، دارد، که منجر به ایجاد تصاویری از دونالد ترامپ و کامالا هریس در حال خلبانی هواپیما در 11 سپتامبر می‌شود، یا تصاویری که به وضوح دارای حق چاپ هستند و ظاهراً هیچ پس‌گیری از گروک ایجاد نمی‌شود.

بیشتر بخوانید

مطالعه جدید: ماه روی اکوسیستم‌ صخره‌های مرجانی تأثیر عجیبی می‌گذارد

به نظر می‌رسد که گوگل با چشم‌انداز محدود خود در تولید تصویر، Imagen 3 را فعلاً روی احتیاط قرار داده است. این که آیا با بهینه سازی و اصلاح مدل تغییر خواهد کرد یا نه، باید دید، اما از آنجایی که اکنون افراد بسیار بیشتری می توانند به آن دسترسی داشته باشند، شاید لازم نباشد مدت زیادی منتظر بمانیم تا ببینیم تا چه حد می توان مرزهای آن را افزایش داد.

شما هم ممکن است دوست داشته باشید

الکس بلیک از اوایل دهه 1990 با کامپیوترها را فریب می داد و از آن زمان تا به حال یک یا دو چیز در مورد فناوری یاد گرفته است. هر چند بیشتر از دو چیز نیست. این تمام چیزی است که مغز او می تواند نگه دارد. علاوه بر TechRadar، الکس برای iMore، Digital Trends و Creative Bloq و غیره می نویسد. او قبلاً در مجله MacFormat ویراستار بود. این بدان معناست که او بیشتر دنیای اپل و آخرین محصولات آن را پوشش می‌دهد، اما ویندوز، تجهیزات جانبی رایانه، برنامه‌های موبایل، و خیلی چیزهای دیگر را نیز پوشش می‌دهد. وقتی نمی نویسد، می توانید او را در حال پیاده روی در حومه شهر انگلیسی و بازی در رایانه شخصی خود بیابید.