Революція рідинного охолодження Nvidia для серверів штучного інтелекту

Mar 12, 2024

[[InfoAuthor]]

Енергоспоживання передових чіпів AI постійно зростає, що стало каталізатором переходу наступного покоління серверів DGX AI на рідинне охолодження. Поточний TDP (теплова потужність) флагманського графічного процесора Nvidia H100 становить 700 Вт, що перевищує межу традиційного повітряного охолодження. Очікується, що Nvidia випустить графічний процесор B100 на архітектурі Blackwell з TDP приблизно 1000 Вт пізніше цього року, і тоді рідинне охолодження точно знадобиться.

Nvidia liquid cooling

Для високопродуктивних обчислювальних систем рідинне охолодження має кілька ключових переваг перед повітряним:
Чудова ефективність теплопередачі дозволяє повністю охолоджувати компоненти з вищим TDP
Завдяки зниженому попиту на високошвидкісні вентилятори робота працює тихіше
Конструкція системи більш щільна, а громіздкі радіатори та вентилятори займають менше місця
Потенціал для уловлювання та повторного використання відпрацьованого тепла в рідинно-рідинних теплообмінниках

GPU liquid cooling

Використовуючи рідинне охолодження, Nvidia може продовжувати перевищувати межі продуктивності прискорювачів ШІ, не обмежуючись системою охолодження. Оскільки складність навчального навантаження штучного інтелекту продовжує зростати, а відповідне апаратне споживання енергії зростає, це має вирішальне значення. Сервер Nvidia DGX зі штучним інтелектом об’єднує кілька графічних процесорів в оптимізовану систему для робочих навантажень зі штучним інтелектом, яку швидко засвоїли великі підприємства. Основні постачальники хмарних послуг, такі як Google Cloud, Meta та Microsoft, розгорнули системи DGX у своїх центрах обробки даних. В останні роки, оскільки все більше і більше організацій прагнуть використовувати трансформаційну силу штучного інтелекту, впровадження систем штучного інтелекту Nvidia DGX зросло в геометричній прогресії.

GPU LIQUID COOLING

У системі Nvidia DGX можуть використовуватися передові конструкції охолодження зануренням, які використовують діелектричні рідини. Пряме охолодження чіпа накачує діелектричні рідини безпосередньо на чіпи графічного процесора та інші теплові компоненти без необхідності використання холодних пластин, що забезпечує більш прямий теплообмін. Він може підтримувати дуже високі рівні TDP (500 Вт+) на одному чіпі, досягаючи більш щільних систем.

Direct chip immersion cooling

Оскільки штучний інтелект продовжує розвиватися з приголомшливою швидкістю, підтримувана апаратна інфраструктура повинна розвиватися синхронно. Рідинне охолодження є ключовою технологією, яка дозволить прискорювачам досягти безпрецедентного рівня продуктивності. Ця трансформація не позбавлена проблем. Оскільки центри обробки даних вимагають трансформації інфраструктури рідинного охолодження та розробки нових програм обслуговування, переваги енергоефективності, щільності та продуктивності є значними, і їх не можна ігнорувати.

Пара: Очікується, що застосування рідинного охолодження прискориться, оператори зв’язку оприлюднили план розвитку технології рідинного охолодження

Наступний: 3D-друк відкриває нові можливості для охолодження мікросхем ШІ

Знання

Революція рідинного охолодження Nvidia для серверів штучного інтелекту