در طول Google I/O 2024 ، غول فناوری Gemini Live را پیشنمایش کرد، نسخه منحصربهفردی از هوش مصنوعی در تلفن همراه که قادر به انجام «مکالمات طبیعی» است. میتوانید مانند سیری به آن فکر کنید، زیرا میتوانید با جمینی گفتگوی دو طرفه داشته باشید و هوش مصنوعی را به طور مختصر پاسخ دهد.
از زمان اعلام اولیه، تا این اواخر که رشتههایی از کدهای ارجاعدهنده Gemini Live در بتای برنامه Google یافت شد، چیز زیادی در مورد این فناوری نشنیده بودیم. این کد به یک «حالت پسزمینه» اشاره میکند که به کاربران امکان میدهد «هنگام استفاده از برنامههای دیگر یا زمانی که صفحه نمایش [آنها] قفل است، به مکالمات ادامه دهند». همانطور که 9To5Google اشاره می کند، این به طور موثر تجربه Gemini Live را به یک تماس تلفنی تبدیل می کند.
هوش مصنوعی همچنان ورودی های صوتی را می پذیرد و همانطور که کارهای دیگر را انجام می دهید پاسخ می دهد. برای مثال، یک کاربر میتواند کروم را در تلفن اندرویدی خود باز کند، چیزی را در موتور جستجو جستجو کند و به طور یکپارچه آن اطلاعات را به Gemini منتقل کند. باز هم هدف این است که صحبت کردن با هوش مصنوعی طبیعی باشد.
9To5Google بیان می کند که تعاملات را می توان با «جستجوی یک اعلان مداوم» یا گفتن «توقف» به جمینی Live با صدای بلند پایان داد.
ویژگی های احتمالی
با این حال، موارد بیشتری در نسخه بتا فراتر از حالت پسزمینه کشف شد.
گوگل ظاهرا در حال کار بر روی راهی است که به کاربران امکان دسترسی سریع به Gemini را زمانی که گوشی هوشمندشان قفل است، بدهد. با نگاهی به اسکرین شات گزارش، میتوانید از چهار افزونه برای سرویسهای شخص اول استفاده کنید: Google Maps ، Google Flights، Google Hotels، و YouTube .
دقیقاً مشخص نیست که میتوانید با آن افزونهها چه کاری انجام دهید، زیرا جزئیات کمیاب است. اما با قضاوت بر اساس آنچه نشان داده شد، کاربران ممکن است بتوانند از Gemini برای مسیرها بپرسند، موسیقی را در YouTube پخش کنند یا پرواز رزرو کنند.
این چهار به طور پیشفرض روشن خواهند شد و ظاهراً گوگل برنامههایی برای گفت ن پشتیبانی برای افزونههای بیشتر دارد. با این حال، یک شکار کوچک وجود دارد. با توجه به اسکرین شات، «برنامههای گفت نی که به اعتبار کاربری نیاز ندارند یا به دادههای خصوصی دسترسی ندارند، بهطور پیشفرض روشن خواهند بود». هر چیز دیگری احتمالاً به فعال سازی دستی نیاز دارد.
علاوه بر این، کاربران می توانند سه ویژگی اضافی را برای Gemini روی صفحه قفل تغییر دهند و سطح کنترل هوش مصنوعی را افزایش دهند. Messages به شما امکان می دهد برای دوستان و خانواده پیامک ارسال کنید، در حالی که Workspace می تواند ایمیل ها یا اسناد را پیدا کرده و خلاصه کند. سپس Home Automation وجود دارد که مسلماً جالبترین است زیرا به صاحبان خانه اجازه میدهد دستگاههای خانه هوشمند را از صفحه قفل مدیریت کنند.
پیشی گرفتن از اپل
زمان عرضه Gemini Live مشخص نیست. در اطلاعیه ماه می آمده است که این نرم افزار قرار است در ماه های آینده به مشترکان Gemini Advanced برسد. تا اینجای کار گوگل سکوت کرده است. شاید قبل از پایان تابستان یا اواخر پاییز آن را ببینیم.
هر زمان که منتشر شود، حالت پسزمینه و تعامل با صفحه قفل میتواند به ارتقاء در برابر شرکتهایی مانند Apple Intelligence متمایز شود. فناوری اپل نیز بسیار توانمند است و انواع ابزارها را برای سازماندهی، ایجاد محتوا و موارد دیگر ارائه می دهد. با این حال، با قضاوت از آنچه که دیدهایم، تعامل دائمی لازم است. Gemini Live سختگیری کمتری دارد که می تواند استفاده از آن را آسان تر کند.
مثل همیشه، این نشت ها را با یک دانه نمک مصرف کنید. همه چیز همیشه می تواند در آخرین لحظه تغییر کند.
اگر به بهترین چت ربات هوش مصنوعی علاقه مند هستید، مقاله Versus ما را تحلیل کنید که در آن سه ربات بزرگ را با هم مقایسه می کنیم: Meta AI، ChatGPT و Google Gemini.
ارسال نظر