مهندسان StorageReview تصمیم گرفتند برای روز Pi امسال (14 مارس - 3/14) کاری فوقالعاده عجیب و غریب انجام دهند - رکورد خود را برای محاسبه Pi شکست دهند. از آنجایی که رکورد قبلی که در سال گذشته به دست آمد، 100 تریلیون رقم بود، این چالش هیچ شاهکاری نبود. در حالی که - هشدار اسپویلر - آنها رکورد را شکستند، 75 روز طول کشید تا آن را به انجام برسانند.
این کار با استفاده از یک سیستم 128 هسته ای AMD EPYC 9754 Bergamo با پردازنده دوگانه، مجهز به 1.5 ترابایت DRAM و تقریباً یک پتابایت حافظه SSD Solidigm QLC به دست آمد.
این تیم محاسبات خود را در 14 دسامبر 2023 آغاز کرد و در 27 فوریه 2024 به مدت 75 روز به پایان رسید. آنها از الگوریتم Chudnovsky (1988) برای محاسبه Pi استفاده کردند و محاسبات به حافظه کلی 1.36 TiB نیاز داشت.
چالش های جدید
سفر به 105 تریلیون رقم پی - رکورد جدید - بدون چالش های جدید نبود. تیم باید با مسائل مربوط به عملکرد دست و پنجه نرم می کرد، که باعث شد آنها را به تحلیل پیچیدگی های محاسبات موازی و تعاملات سخت افزاری بپردازند. آنها یک خطر CPU خاص معماری Zen4 را کشف کردند که شامل تراز فوق العاده و اثرات آن بر الگوهای دسترسی به حافظه است.
مهندسان همچنین با یک خطای محاسباتی ممیز شناور در مسیر کد AVX512 الگوریتم ضرب N63 مواجه شدند. با کمک از راه دور توسعه دهنده، الکساندر یی، آنها توانستند مشکل را تشخیص داده و برطرف کنند و در نتیجه محاسبات موفقیت آمیز انجام شد.
جردن رانوس از StorageReview به طور خلاصه بيان کرد : «اجرای 105 تریلیون رقم پی بسیار پیچیدهتر از آن چیزی بود که ما انتظار داشتیم. پس از تأمل، باید انتظار داشت که با مسائل جدیدی روبرو شویم. پس از همه، ما در حال تکمیل محاسباتی هستیم که قبلا هرگز انجام نشده بود. اما با 100 تریلیون محاسبات تکمیل شده با پیکربندی بسیار بیشتر "نوار و سیم مرغ"، ما فکر کردیم که آن را ساخته ایم. در نهایت، تلاش مشترک برای رساندن این دکل از خط پایان لازم بود."
ارزشش را داشت؟ رانوس او میگوید : «در حالی که با شرکای خود در این رکوردشکنی شادی میکنیم، باید بپرسیم که «این اصلاً به چه معناست؟» پنج تریلیون رقم بیشتر از پی احتمالاً تفاوت زیادی در ریاضیات ایجاد نخواهد کرد. با این حال، میتوانیم خطوطی بین بارهای کاری محاسباتی و نیاز به سختافزار زیربنایی مدرن برای پشتیبانی از آنها ترسیم کنیم. اساساً، این تمرین نشان میدهد که سختافزار مناسب همه تفاوت را ایجاد میکند، چه یک خوشه مرکز داده سازمانی یا یک قسط بزرگ HPC. برای محاسبات Pi، ما کاملاً توسط ذخیره سازی محدود شده بودیم. پردازندههای سریعتر به سرعت بخشیدن به ریاضیات کمک میکنند، اما عامل محدودکننده بسیاری از رکوردهای جدید جهانی، میزان ذخیرهسازی محلی در جعبه است.
در ادامه میتوانید ویدیوی رکوردشکنی را تماشا کنید.
ارسال نظر