متن خبر

خوشه ابرکامپیوتری Colossus xAI از 100000 پردازنده گرافیکی Nvidia Hopper استفاده می کند – و همه اینها با استفاده از پلت فرم شبکه اترنت Spectrum-X Nvidia امکان پذیر شد.

خوشه ابرکامپیوتری Colossus xAI از 100000 پردازنده گرافیکی Nvidia Hopper استفاده می کند – و همه اینها با استفاده از پلت فرم شبکه اترنت Spectrum-X Nvidia امکان پذیر شد.

شناسهٔ خبر: 810854 -




Nvidia H100
(اعتبار تصویر: Nvidia)

Nvidia و xAI در توسعه Colossus با یکدیگر همکاری می کنند

xAI به طور قابل توجهی «برخورد جریان» را در طول آموزش مدل هوش مصنوعی کاهش داده است

Spectrum-X در آموزش خانواده مدل هوش مصنوعی Grok بسیار مهم بوده است


انویدیا روشن کرده است که چگونه خوشه ابررایانه «Colossus» xAI می‌تواند 100000 پردازنده گرافیکی Hopper را کنترل کند - و همه اینها به استفاده از پلتفرم شبکه اترنت Spectrum-X سازنده تراشه بستگی دارد.

این شرکت فاش کرد که Spectrum-X به گونه ای طراحی شده است که با استفاده از شبکه Remote Directory Memory Access (RDMA) قابلیت های عملکردی عظیمی را برای کارخانه های هوش مصنوعی چند مستاجر و در مقیاس فوق العاده فراهم کند.

این پلتفرم از زمان آغاز به کار در Colossus، بزرگترین ابررایانه هوش مصنوعی جهان، مستقر شده است. شرکت متعلق به ایلان ماسک از این کلاستر برای آموزش مدل‌های زبان بزرگ گروک (LLM) استفاده می‌کند که ربات‌های گفتگوی ارائه شده به کاربران X را تقویت می‌کند.

این تسهیلات با همکاری انویدیا تنها در 122 روز ساخته شد و xAI در حال حاضر در حال توسعه آن است و برنامه‌هایی برای استقرار در مجموع 200000 پردازنده گرافیکی Nvidia Hopper دارد.

آموزش Grok به قدرت آتش جدی نیاز دارد

مدل‌های Grok AI بسیار بزرگ هستند و Grok-1 با 314 میلیارد پارامتر و Grok-2 عملکرد بهتری از Claude 3.5 Sonnet و GPT-4 Turbo در زمان پرتاب در ماه آگوست دارد.

به طور طبیعی، آموزش این مدل ها به عملکرد شبکه قابل توجهی نیاز دارد. با استفاده از پلتفرم Spectrum-X انویدیا، xAI به‌خاطر «تصادف جریان» یا تنگناها در مسیرهای شبکه‌ای هوش مصنوعی، تخریب میراث برنامه‌ها یا از دست دادن بسته‌ها را به صفر ثبت کرد.

xAI فاش کرد که قادر به حفظ 95 درصد توان عملیاتی داده است که توسط قابلیت های کنترل تراکم Spectrum-X فعال شده است. این شرکت اضافه کرد که این سطح از عملکرد را نمی توان در این مقیاس از طریق اترنت استاندارد ارائه کرد.

به گفته انویدیا، با استفاده از اترنت سنتی، این معمولاً هزاران برخورد جریان را ایجاد می کند در حالی که تنها 60 درصد توان داده را ارائه می دهد.

یکی از سخنگویان xAI گفت: ترکیب پردازنده‌های گرافیکی Hopper و Spectrum-X به شرکت این امکان را داده است که «محدوده‌های آموزش مدل‌های هوش مصنوعی را پیش ببرد» و یک «کارخانه هوش مصنوعی فوق‌العاده شتاب‌یافته و بهینه‌شده» ایجاد کند.

گیلاد شاینر، معاون ارشد شبکه در انویدیا گفت: هوش مصنوعی در حال تبدیل شدن به یک ماموریت حیاتی است و به افزایش عملکرد، امنیت، مقیاس‌پذیری و کارایی هزینه نیاز دارد.

پلتفرم شبکه اترنت NvidiaSpectrum-X طوری طراحی شده است که نوآورانی مانند xAI را با پردازش، تجزیه و تحلیل و اجرای سریع‌تر بارهای کاری هوش مصنوعی ارائه می‌کند و به نوبه خود توسعه، استقرار و زمان عرضه راه‌حل‌های هوش مصنوعی را سرعت می‌بخشد.

به گفته انویدیا، بخشی از پلتفرم Spectrum-X شامل سوئیچ اترنت Spectrum SN5600 است - طبق گفته انویدیا، این سوئیچ از سرعت پورت تا 800 گیگابیت بر ثانیه پشتیبانی می کند و بر اساس سوئیچ Spectrum-4 ASIC است.

xAI تصمیم گرفت سوئیچ Spectrum-X SN5600 را با NVIDIA BlueField-3 SuperNIC برای عملکرد بالاتر ترکیب کند.

شما هم ممکن است دوست داشته باشید

ویرایشگر اخبار و تحلیل، ITPro

راس کلی ویرایشگر اخبار و تحلیل در ITPro است و مسئول رهبری خروجی اخبار برند و گزارش‌دهی عمیق در مورد آخرین داستان‌ها از سراسر چشم‌انداز فناوری کسب‌وکار است.

خبرکاو

ارسال نظر




تبليغات ايهنا تبليغات ايهنا

تمامی حقوق مادی و معنوی این سایت متعلق به خبرکاو است و استفاده از مطالب با ذکر منبع بلامانع است