Nvidia و xAI در توسعه Colossus با یکدیگر همکاری می کنند
xAI به طور قابل توجهی «برخورد جریان» را در طول آموزش مدل هوش مصنوعی کاهش داده است
Spectrum-X در آموزش خانواده مدل هوش مصنوعی Grok بسیار مهم بوده است
انویدیا روشن کرده است که چگونه خوشه ابررایانه «Colossus» xAI میتواند 100000 پردازنده گرافیکی Hopper را کنترل کند - و همه اینها به استفاده از پلتفرم شبکه اترنت Spectrum-X سازنده تراشه بستگی دارد.
این شرکت فاش کرد که Spectrum-X به گونه ای طراحی شده است که با استفاده از شبکه Remote Directory Memory Access (RDMA) قابلیت های عملکردی عظیمی را برای کارخانه های هوش مصنوعی چند مستاجر و در مقیاس فوق العاده فراهم کند.
این پلتفرم از زمان آغاز به کار در Colossus، بزرگترین ابررایانه هوش مصنوعی جهان، مستقر شده است. شرکت متعلق به ایلان ماسک از این کلاستر برای آموزش مدلهای زبان بزرگ گروک (LLM) استفاده میکند که رباتهای گفتگوی ارائه شده به کاربران X را تقویت میکند.
این تسهیلات با همکاری انویدیا تنها در 122 روز ساخته شد و xAI در حال حاضر در حال توسعه آن است و برنامههایی برای استقرار در مجموع 200000 پردازنده گرافیکی Nvidia Hopper دارد.
آموزش Grok به قدرت آتش جدی نیاز دارد
مدلهای Grok AI بسیار بزرگ هستند و Grok-1 با 314 میلیارد پارامتر و Grok-2 عملکرد بهتری از Claude 3.5 Sonnet و GPT-4 Turbo در زمان پرتاب در ماه آگوست دارد.
به طور طبیعی، آموزش این مدل ها به عملکرد شبکه قابل توجهی نیاز دارد. با استفاده از پلتفرم Spectrum-X انویدیا، xAI بهخاطر «تصادف جریان» یا تنگناها در مسیرهای شبکهای هوش مصنوعی، تخریب میراث برنامهها یا از دست دادن بستهها را به صفر ثبت کرد.
xAI فاش کرد که قادر به حفظ 95 درصد توان عملیاتی داده است که توسط قابلیت های کنترل تراکم Spectrum-X فعال شده است. این شرکت اضافه کرد که این سطح از عملکرد را نمی توان در این مقیاس از طریق اترنت استاندارد ارائه کرد.
به گفته انویدیا، با استفاده از اترنت سنتی، این معمولاً هزاران برخورد جریان را ایجاد می کند در حالی که تنها 60 درصد توان داده را ارائه می دهد.
یکی از سخنگویان xAI گفت: ترکیب پردازندههای گرافیکی Hopper و Spectrum-X به شرکت این امکان را داده است که «محدودههای آموزش مدلهای هوش مصنوعی را پیش ببرد» و یک «کارخانه هوش مصنوعی فوقالعاده شتابیافته و بهینهشده» ایجاد کند.
گیلاد شاینر، معاون ارشد شبکه در انویدیا گفت: هوش مصنوعی در حال تبدیل شدن به یک ماموریت حیاتی است و به افزایش عملکرد، امنیت، مقیاسپذیری و کارایی هزینه نیاز دارد.
پلتفرم شبکه اترنت NvidiaSpectrum-X طوری طراحی شده است که نوآورانی مانند xAI را با پردازش، تجزیه و تحلیل و اجرای سریعتر بارهای کاری هوش مصنوعی ارائه میکند و به نوبه خود توسعه، استقرار و زمان عرضه راهحلهای هوش مصنوعی را سرعت میبخشد.
به گفته انویدیا، بخشی از پلتفرم Spectrum-X شامل سوئیچ اترنت Spectrum SN5600 است - طبق گفته انویدیا، این سوئیچ از سرعت پورت تا 800 گیگابیت بر ثانیه پشتیبانی می کند و بر اساس سوئیچ Spectrum-4 ASIC است.
xAI تصمیم گرفت سوئیچ Spectrum-X SN5600 را با NVIDIA BlueField-3 SuperNIC برای عملکرد بالاتر ترکیب کند.
ارسال نظر