هوش مصنوعی Gemini گوگل در زمان نگارش این مقاله تنها دو ماه است که وجود داشته است و در حال حاضر، این شرکت در حال عرضه مدل نسل بعدی خود با نام Gemini 1.5 است.
پست اعلان به توضیح کامل تمام پیشرفتهای هوش مصنوعی میپردازد. همه اینها کاملاً فنی است، اما نکته اصلی این است که Gemini 1.5 "عملکرد به طور چشمگیری بهبود یافته" را ارائه می دهد. اجرای این ساختار باعث شد که Gemini آسان تر شود و همچنین در یادگیری کارهای پیچیده سریعتر از قبل عمل کند.
برنامههایی برای عرضه بهروزرسانی به هر سه نسخه اصلی هوش مصنوعی وجود دارد، اما تنها نسخهای که امروز برای آزمایش اولیه منتشر شده، Gemini 1.5 Pro است.
چیزی که در مورد آن منحصر به فرد است این است که مدل دارای "پنجره زمینه تا 1 میلیون توکن" است. توکنها ، همانطور که به هوش مصنوعی مولد مربوط میشوند، کوچکترین دادههایی هستند که LLM (مدلهای زبان بزرگ) از آن برای پردازش و تولید متن استفاده میکنند. پنجره های زمینه بزرگتر به هوش مصنوعی اجازه می دهد تا اطلاعات بیشتری را به طور همزمان مدیریت کند. و یک میلیون توکن بسیار بزرگ است، بسیار بیشتر از آنچه GPT-4 Turbo می تواند انجام دهد. موتور OpenAI ، برای مقایسه، دارای سقف پنجره زمینه 128000 توکن است.
Gemini Pro در عمل
با تمام این اعداد، سوال این است که Gemini 1.5 Pro در عمل چگونه به نظر می رسد؟ گوگل چندین ویدیو ساخت که توانایی های هوش مصنوعی را به نمایش گذاشت. مسلماً، این چیزهای بسیار جالبی است زیرا نشان می دهد که چگونه مدل ارتقا یافته می تواند مقادیر زیادی از متن را بر اساس یک درخواست تجزیه و تحلیل و خلاصه کند.
در یک مثال ، آنها رونوشت بیش از 400 صفحه ای از ماموریت ماه آپولو 11 را به Gemini 1.5 Pro دادند. این نشان داد که هوش مصنوعی میتواند جزئیات خاصی را در سند «درک، استدلال و شناسایی کند». درخواستکننده از هوش مصنوعی میخواهد «لحظههای کمدی» را در طول مأموریت پیدا کند. پس از 30 ثانیه، Gemini 1.5 Pro موفق شد چند جوک را پیدا کند که فضانوردان هنگام حضور در فضا آنها را انجام دادهاند، از جمله اینکه چه کسی آنها را گفته و هر مرجعی را توضیح داده است.
این مهارت های تجزیه و تحلیل را می توان برای روش های دیگر استفاده کرد. در نسخه ی نمایشی دیگری، تیم توسعه دهنده یک فیلم ۴۴ دقیقه ای باستر کیتون را به هوش مصنوعی داد. آنها طرحی نادر از یک برج آب در حال فوران را آپلود کردند و سپس مُهر زمانی صحنهای که شامل یک برج آب بود را خواستند. مطمئناً، آن قسمت دقیقاً ده دقیقه بعد از فیلم پیدا شد. به خاطر داشته باشید که این کار بدون هیچ توضیحی در مورد خود نقاشی یا متن دیگری غیر از سوال انجام شد. Gemini 1.5 Pro متوجه شد که این یک برج آبی بدون کمک اضافی است.
فناوری تجربی
این مدل در حال حاضر برای عموم در دسترس نیست. در حال حاضر، به عنوان یک پیشنمایش اولیه به «توسعهدهندگان و مشتریان سازمانی» از طریق پلتفرمهای هوش مصنوعی استودیوی Google و Vertex AI به صورت رایگان ارائه میشود. این شرکت به آزمایش کنندگان هشدار می دهد که ممکن است زمان تاخیر طولانی را تجربه کنند زیرا هنوز آزمایشی است. با این حال، برنامه هایی برای بهبود سرعت در خط وجود دارد.
ما با گوگل تماس گرفتیم و در مورد اینکه مردم چه زمانی می توانند منتظر عرضه Gemini 1.5 و Gemini 1.5 Ultra به همراه عرضه گسترده تر این مدل های هوش مصنوعی نسل بعدی باشند، اطلاعاتی را درخواست کردیم. این داستان متعاقبا آپدیت خواهد شد. تا آن زمان، جمع بندی TechRadar از بهترین تولیدکنندگان محتوای هوش مصنوعی برای سال 2024 را تحلیل کنید.
ارسال نظر