بهترین تولیدکنندههای تصویر هوش مصنوعی اخیراً در اخبار بودهاند، اما نه همیشه به دلایل درست - با هوش مصنوعی Grok-2 ایلان ماسک که انواع بحثها را بر سر عدم وجود نردههای محافظ ایجاد میکند. گوگل احتمالاً میخواهد گفتگو را در جهت مثبتتری تغییر دهد، زیرا این شرکت به تازگی دسترسی به ژنراتور Imagen 3 خود را برای همه در ایالات متحده گسترش داده است و به طور گسترده افرادی را که میتوانند از ابزار هوش مصنوعی استفاده کنند، افزایش داده است.
مقاله تحقیقاتی همراه گوگل، Imagen 3 را به عنوان "مدل انتشار نهفته ای که تصاویر با کیفیت بالا را از پیام های متنی تولید می کند" توصیف می کند و مقاله اضافه می کند که "Imagen 3 در زمان ارزیابی بر سایر مدل های پیشرفته ترجیح داده می شود." میتوان از آن برای جمعآوری تصاویر بر اساس متن وارد شده توسط کاربر، با محدودیتهایی در مورد محتوای توهینآمیز یا غیرقانونی استفاده کرد که آن را به رقیب جایگزینهای محبوبی مانند Midjourney تبدیل میکند.
این ابزار ابتدا در ماه می 2024 در رویداد Google I/O راه اندازی شد، اما در آن زمان به کاربران منتخب Vertex AI گوگل محدود می شد. اکنون، هر کسی در ایالات متحده میتواند در صورت تمایل آن را امتحان کند، که نشان میدهد گوگل به توانایی ابزار خود برای ایجاد تصاویر قابل اعتماد و اجتناب از برخی از مشکلاتی که برای مدت طولانی تولیدکنندههای تصویر هوش مصنوعی را درگیر کرده است، بسیار مطمئنتر است.
به نظر می رسد تاکنون واکنش ها نسبت به Imagen 3 متفاوت بوده است. چندین کاربر متوجه شده اند که به نظر می رسد نسبت به درخواست های کاربر بسیار حساس تر از قبل است و کلماتی را که ممکن است در Imagen 2 مسدود نشده باشند سانسور می کند.
به عنوان مثال، یکی از کاربران در Reddit گفت: "واقعاً باید برای رسیدن به آنچه قبلاً به دست می آوردم کار اضافی انجام دهم و یک کلمه تصادفی مانند "جوراب" یا "آب" فیلتر سانسور را فعال می کند که به کلمات بدخیم بسیار حساس تر است. ” برای دیگری ، Imagen 3 از ترسیم ایدههای بیگناه مانند سایبورگ یا مردی که دستانش را روی هم میگذارد، خودداری کرد. با این حال، نکات مثبتی وجود دارد که یکی از کاربران فوقالذکر به خروجی با کیفیت بالا و «تشخیص بافت و کلمه شگفتانگیز» اشاره کرده است.
چگونه Imagen 3 را امتحان کنیم
اگر میخواهید Imagen 3 را برای چرخش انتخاب کنید، ابتدا باید در ایالات متحده مستقر باشید تا دسترسی داشته باشید. اگر هستید، می توانید به وب سایت AI Test Kitchen گوگل بروید و با حساب Google خود وارد شوید. پس از انجام این کار، باید بتوانید از مدل جدید تولید تصویر استفاده کنید.
گزارشهای کاربران مبنی بر اینکه Imagen 3 محدودتر از نسخه قبلی خود است، یک تصویر مفید از وضعیت فعلی تولیدکنندههای تصویر هوش مصنوعی است. در ماههای اخیر جنجالهای زیادی توسط این ابزارها ایجاد شده است و گاهی اوقات به نظر میرسد هفتهای نمیگذرد که برخی از تصاویر تولید شده توسط هوش مصنوعی احساسات اینترنت را تحریک نکند.
آخرین مقصر، هوش مصنوعی Grok-2 ایلان ماسک بوده است. این ابزار - که محدود به کاربران ممتاز X (توئیتر سابق) است، بهتازگی به نسخه دوم خود بهروزرسانی شد و تصاویر را با استفاده از منبع باز Flux تولید میکند. کاربران دریافتند که محدودیتهای بسیار کمی در مورد آنچه که میتوان ایجاد کرد، دارد، که منجر به ایجاد تصاویری از دونالد ترامپ و کامالا هریس در حال خلبانی هواپیما در 11 سپتامبر میشود، یا تصاویری که به وضوح دارای حق چاپ هستند و ظاهراً هیچ پسگیری از گروک ایجاد نمیشود.
به نظر میرسد که گوگل با چشمانداز محدود خود در تولید تصویر، Imagen 3 را فعلاً روی احتیاط قرار داده است. این که آیا با بهینه سازی و اصلاح مدل تغییر خواهد کرد یا نه، باید دید، اما از آنجایی که اکنون افراد بسیار بیشتری می توانند به آن دسترسی داشته باشند، شاید لازم نباشد مدت زیادی منتظر بمانیم تا ببینیم تا چه حد می توان مرزهای آن را افزایش داد.
ارسال نظر