Tri-Labs (متشکل از سه موسسه تحقیقاتی بزرگ ایالات متحده - آزمایشگاه ملی لارنس لیورمور (LLNL)، آزمایشگاه ملی ساندیا (SNL) و آزمایشگاه ملی لوس آلاموس (LANL)) با شرکت هوش مصنوعی Cerebras بر روی تعدادی از مشکلات علمی کار کرده است. از جمله شکستن سد مقیاس زمانی دینامیک مولکولی (MD).
مقاله ای برای توضیح این چالش خاص وجود دارد که می توانید آن را اینجا بخوانید، اما اساساً به مشکل انجام شبیه سازی دینامیک مولکولی در مقیاس زمانی بزرگتر از آنچه که معمولاً ممکن است اشاره دارد.
موانع در اینجا دو دسته هستند: توان محاسباتی و تأخیر ارتباط بین گره های مختلف یک سیستم HPC. به طور سنتی، برای جبران کمبود قدرت محاسباتی، دانشمندان کار بیشتری را به هر گره اختصاص می دهند و اندازه شبیه سازی را با تعداد گره ها افزایش می دهند. متأسفانه، ارتباط آهسته بین گره ناشی از تأخیر بالا، مشکل مقیاس زمانی را تشدید می کند.
مثل دونات
شبیهسازیهای MD برای چندین زمینه علمی بسیار مهم هستند، زیرا شکاف بین روشهای الکترونیک کوانتومی و روشهای مکانیک پیوسته را پر میکنند. با این حال، این شبیهسازیها با محدودیتهای مقیاس زمانی مواجه میشوند، زیرا باید ارتعاشات اتمی را که در مقیاسهای زمانی بسیار کوتاه اتفاق میافتند و سایر پدیدههایی که در دورههای بسیار طولانیتر رخ میدهند، در نظر بگیرند.
نویسندگان مقاله به دنبال غلبه بر مانع مقیاس زمانی با استفاده از یک سیستم محاسباتی کارآمدتر، به ویژه موتور مقیاس ویفری Cerebras بودند.
همانطور که The Next Platform توضیح می دهد، "شبیه سازی خاص این بود که تابش را به سه شبکه کریستالی مختلف ساخته شده از تنگستن، مس و تانتالیوم بتاباند. در این شبیه سازی های خاص، که برای 801792 اتم در هر شبکه بود، ایده این است که شبکه ها را با تشعشع بمباران کنیم و ببینیم چه اتفاقی می افتد.
با اجرای شبیهسازیها بر روی Frontier، سریعترین ابررایانه جهان مستقر در آزمایشگاه ملی Oak Ridge در تنسی، و بر روی کوارتز در LLNL، دانشمندان تنها توانستند نانوثانیههایی از اتفاقاتی که برای شبکهها میافتد را در هنگام بمباران پرتوها مشاهده کنند. با استفاده از WSE، دهها میلیثانیه زمان برای تماشای اتفاقات داده شد.
برای آزمایشها، Tri-Labs از Cerebras Wafer Scale Engine 2 (WSE-2) به جای جدیدتر و قدرتمندتر WSE-3 که اوایل امسال راه اندازی شد ، استفاده کرد، اما همانطور که در بالا توضیح داده شد، نتایج چشمگیر بود. همانطور که مقاله گزارش میکند، «با اختصاص یک هسته پردازشگر برای هر اتم شبیهسازیشده، ما بهبود ۱۷۹ برابری را در گامهای زمانی در ثانیه در مقایسه با پلتفرم Exascale مبتنی بر GPU Frontier، همراه با بهبود زیادی در گامهای زمانی در واحد انرژی نشان میدهیم. کاهش هر سال زمان اجرا به دو روز، بازههای زمانی غیرقابل دسترس فرآیندهای تبدیل ریزساختار آهسته را که برای درک رفتار و عملکرد مواد حیاتی هستند، باز میکند.
تیموتی پریکت مورگان، مدیر عامل و یکی از بنیانگذاران سربراس، اندرو فلدمن، از پلتفرم بعدی ، از اندرو فلدمن پرسید که وقتی چندین موتور مقیاس ویفر را به هم متصل میکنید و سعی میکنید شبیهسازی مشابهی را اجرا کنید، چه اتفاقی میافتد و به او گفته شد: «هنوز هیچکس نمیداند».
پریکت مورگان ادامه داد: "اتصال اختصاصی در سیستم های WSE-2 می تواند به 192 دستگاه برسد، و با WSE-3، این تعداد بیش از یک مرتبه به 2048 دستگاه افزایش یافت." مشکوک است که همان اصول مقیاسبندی برای WSEها اعمال میشود که برای GPUها و CPUها اعمال میشود.»
با این حال، او پیشنهاد داد که میتوان راهی برای اتصال فیزیکی WSEها به یکدیگر و ساختن «لولهای از مربعهای WSEs متصل به هم» وجود داشت، که به طور بالقوه طرحی از دونات ایجاد میکند که برق در داخل کار میکند و در خارج خنک میشود. همانطور که پریکت مورگان نتیجه می گیرد، "این نوع پیکربندی نمی تواند بدتر از استفاده از InfiniBand یا اترنت برای اتصال CPU ها یا GPU ها باشد."
ارسال نظر