Революція рідинного охолодження Nvidia для серверів штучного інтелекту
Енергоспоживання передових чіпів AI постійно зростає, що стало каталізатором переходу наступного покоління серверів DGX AI на рідинне охолодження. Поточний TDP (теплова потужність) флагманського графічного процесора Nvidia H100 становить 700 Вт, що перевищує межу традиційного повітряного охолодження. Очікується, що Nvidia випустить графічний процесор B100 на архітектурі Blackwell з TDP приблизно 1000 Вт пізніше цього року, і тоді рідинне охолодження точно знадобиться.

Для високопродуктивних обчислювальних систем рідинне охолодження має кілька ключових переваг перед повітряним:
Чудова ефективність теплопередачі дозволяє повністю охолоджувати компоненти з вищим TDP
Завдяки зниженому попиту на високошвидкісні вентилятори робота працює тихіше
Конструкція системи більш щільна, а громіздкі радіатори та вентилятори займають менше місця
Потенціал для уловлювання та повторного використання відпрацьованого тепла в рідинно-рідинних теплообмінниках

Використовуючи рідинне охолодження, Nvidia може продовжувати перевищувати межі продуктивності прискорювачів ШІ, не обмежуючись системою охолодження. Оскільки складність навчального навантаження штучного інтелекту продовжує зростати, а відповідне апаратне споживання енергії зростає, це має вирішальне значення. Сервер Nvidia DGX зі штучним інтелектом об’єднує кілька графічних процесорів в оптимізовану систему для робочих навантажень зі штучним інтелектом, яку швидко засвоїли великі підприємства. Основні постачальники хмарних послуг, такі як Google Cloud, Meta та Microsoft, розгорнули системи DGX у своїх центрах обробки даних. В останні роки, оскільки все більше і більше організацій прагнуть використовувати трансформаційну силу штучного інтелекту, впровадження систем штучного інтелекту Nvidia DGX зросло в геометричній прогресії.

У системі Nvidia DGX можуть використовуватися передові конструкції охолодження зануренням, які використовують діелектричні рідини. Пряме охолодження чіпа накачує діелектричні рідини безпосередньо на чіпи графічного процесора та інші теплові компоненти без необхідності використання холодних пластин, що забезпечує більш прямий теплообмін. Він може підтримувати дуже високі рівні TDP (500 Вт+) на одному чіпі, досягаючи більш щільних систем.

Оскільки штучний інтелект продовжує розвиватися з приголомшливою швидкістю, підтримувана апаратна інфраструктура повинна розвиватися синхронно. Рідинне охолодження є ключовою технологією, яка дозволить прискорювачам досягти безпрецедентного рівня продуктивності. Ця трансформація не позбавлена проблем. Оскільки центри обробки даних вимагають трансформації інфраструктури рідинного охолодження та розробки нових програм обслуговування, переваги енергоефективності, щільності та продуктивності є значними, і їх не можна ігнорувати.






