مشترکین Premium X (توئیتر سابق) اکنون می توانند از دستیار Grok AI بخواهند که تصاویر را توصیف کند، نه فقط آنها را بسازد. شرکت xAI متعلق به Elon Musk از ویژگی جدیدی برای تجزیه و تحلیل محتوای بصری پرده برداری کرد که به آن توانایی توصیف عکس ها، نمودارها و سایر عکس های فوری را با استفاده از مدل Grok-2 AI می دهد که به چت ربات هوش مصنوعی و ایجاد تصویر با هوش مصنوعی Flux آن قدرت می دهد.
این ویژگی Grok را با ChatGPT ، Gemini و سایر رقبا برابری می کند. اگر مشترک برنامههای اشتراک X هستید، میتوانید با کلیک بر روی دکمهای در یک پست تصویر در X و پرسیدن سؤالات Grok در مورد تصویر یا صرفاً برای یک تحلیل توصیفی مستقیم، آن را امتحان کنید.
در کنار این ویژگی جدید، Grok یک معیار جدید به نام RealWorldQA را نشان داد که قرار است نشان دهد یک مدل چقدر می تواند یک تصویر دنیای واقعی را توصیف کند، از جمله فضای بین اشیا. این شرکت ادعا می کند که RealWorldQA نشان می دهد که Grok در توضیح تصاویر به خوبی یا بهتر از رقبای خود عمل می کند، حتی اگر هنوز در حال توسعه است. در زیر میتوانید نمونهای از نحوه عملکرد آن را ببینید که توسط ایلان ماسک در X به اشتراک گذاشته شده است .
گروک اکنون تصاویر را میفهمد، حتی معنای یک جوک را توضیح میدهد. این نسخه اولیه است. به سرعت بهبود خواهد یافت. https://t.co/gQ5BBISVRc 28 اکتبر 2024
ببین و گروک
همانطور که اسکرین شات نشان می دهد، Grok می تواند یک تصویر پیچیده چند مرحله ای را بشکند و توضیح دهد که چه اتفاقی در آن می افتد. سپس میتواند طنز جوک را تعمیم دهد، اگرچه، همانطور که تقریباً همیشه اتفاق میافتد، توضیح جوک آن را بسیار خندهدار میکند. با این حال، این نشانه آن است که xAI با قرار دادن ویژگی های جدید برای Grok، به ویژه ابزارهای چند وجهی، تمام نشده است. این می تواند گامی به سوی Grok باشد که بتواند محتوای صوتی و تصویری را به همان روشی که با تصاویر بصری توضیح می دهد، توضیح دهد.
یکی از عناصری که ذکر نشده این است که چگونه تجزیه و تحلیل بصری توسط Grok ممکن است ایجاد تصویر آزادانه توسط چت ربات هوش مصنوعی را به تصویر بکشد که به نظر میرسد در مورد مسائل حق چاپ یا کپیرایت ابهام کمی دارد یا اصلاً بیتفاوت است. این چیزی است که کاربرانی که تصاویری از ماریو میسازند، زمانی که Tracer شکارچی نقض حق نسخهبرداری نینتندو به دنبال نقض آنها رفت، با آن مواجه شدند. اینکه آیا تصویر هوش مصنوعی ماریو یا هر مالکیت معنوی دیگری به این صورت توصیف شود یا به عبارت کلی تر، جالب است که کشف کنید.
از آنجایی که مالک xAI هست، پتانسیل بسیار واضحی برای این ویژگی در سایر شرکت های فناوری متعلق به ماسک وجود دارد. رانندگی نیمه خودران تسلا مطمئناً از توانایی شناسایی افراد و اشیاء اطراف و نحوه فاصله آنها از یکدیگر سود می برد. همین امر در مورد رباتهای انساننما که مدتها وعده داده بود، تسلا در حال توسعه در چند سال گذشته بود.
ارسال نظر