ISC 2015: новые суперкомпьютеры РСК. Репортаж
29.07.2015
Группа компаний
Согласно свежему списку
Во-первых, резко повысилась плотность размещения узлов в шкафу – теперь их 153 вместо 128. Кроме того, сменилась ориентация – вместо ранее использовавшегося вертикального размещения узлов на полке в новом поколении предлагается 51 «полочка» на три узла. Естественно, это потребовало и некоторых других изменений в конструкции. Шкафы, блоки питания и сами узлы стали легче. Шкафы обзавелись поддержкой более эффективных систем жидкостного охлаждения и питания, кроме того, они готовы к использованию различных вариантов связи между узлами – InfiniBand, Intel OmniPath, 10/40 GbE. При этом сама конструкция шкафа имеет разумные габариты и, в отличие от решений некоторых других производителей (не будем показывать пальцем) с их высоченными 19” кабинетами, удобна в обслуживании.
Сами узлы также подверглись некоторым конструкционным улучшениям – появилась новая защитная крышка, разъём питания стал унифицированным для всех типов узлов, а доступ к заменяемым компонентам стал проще (например, для модулей памяти есть специальные окошки). Блоки питания выполнены в том же форм-факторе, что и остальные узлы, и содержат в себе преобразователи 220 В AC ↔ 400 В DC, что также приводит к снижению потерь энергии. Один БП по умолчанию обслуживает до 16 вычислительных узлов, так что стандартная конфигурация кабинета выглядит так: 9 блоков питания и 144 «лезвия». Предусмотрена возможность параллельной работы БП на общую шину. Впрочем, никто не мешает отдельно завести питание в шкаф и полностью набить его узлами. Либо же, наоборот, последовательно сменить часть узлов на БП, достигая таким образом нужного уровня резервирования по питанию – от N+1 до N+N.
Но, конечно, главная фишка нового решения – это полностью жидкостное охлаждение всей системы, да не простое, а умное. В каждый шкаф можно установить до девяти насосных модулей с возможностью резервирования вплоть до N+N. При этом доступна и возможность горячей замены модулей, и возможность включения их в единый контур охлаждения. Вся система изначально рассчитана на фрикулинг с температурой «забортного» воздуха вплоть до +40 °C, что в конечном итоге позволяет снизить операционные расходы на её работу на 30 %. Вторая важная и уникальная особенность – возможность работы системы охлаждения с водой, температура которой может составлять до +65 °C. На выставке РСК представила первый в мире образец узла, поддерживающий такой режим работы. Для сравнения: подавляющее большинство производителей если и предлагает такую возможность, то только для температур не выше +45 °C.
Наконец, последнее нововведение в списке – это оснащение непосредственно вычислительных узлов. Здесь, в общем, для простоты можно лишь процитировать слова представителя компании: «Новое поколение «РСК Торнадо» построено на базе серверных процессоров Intel Xeon E5-2600 v3, серверных плат Intel S2600KP и твердотельных накопителей Intel SSD DC S3500/3600/3700 для ЦОД, что даёт повышение вычислительной плотности – более 200 Тфлопс/м3 на стандартных процессорах и до 256 Гбайт оперативной памяти на узел». Кроме того, каждый узел оснащён специальным контроллером для телеметрии и интеллектуального управления не только отдельными элементами, но и всей вычислительной системой в целом. В том числе с возможностью настраиваемой реакции на выход из строя или деградацию отдельных подсистем, обновление оборудования и другие штатные и нештатные ситуации.
Впрочем, показателем правильности выбранного пути и решений являются не все эти дикие флопсы производительности и не участие в списках TOP500, который, во-первых, как ни крути, всё ж таки несколько однобок, а во-вторых, в него попадают только публичные системы и, например, машина на «лезвиях» с «Эльбрусами» (а есть и такие, да!) в нём может и не засветиться. Гораздо занятнее наблюдать за тем, как крупные и старые компании аккуратно и постепенно заимствуют те решения, которые безбоязненно внедряет «молодёжь». Или же за тем, как другие, не менее крупные, соглашаются подгонять свои продукты под нужды таких заказчиков. Просто для примера – Intel поставляет РСК слегка видоизменённые карты Xeon Phi. В конце концов, важнее всего всё-таки конкретные внедрения решений компании.
Таким образом, 94 % всех компонентов снабжены именно СЖО. Кроме того, разработчик отмечает, что система построена на базе одних и тех же компонентов (CPU, SSD, материнские платы, память), за счёт чего появляется возможность гибко распределить текущую нагрузку между всеми узлами или быстро перекинуть задачи с одних узлов на другие в случае, например, сбоя питания. Хотя об этом создатели тоже позаботились – к центру подведены две линии питания на 1,3 МВт, дополненные рядом ИБП, которые обеспечивают до 10 минут работы вычислительных узлов и до 17 минут функционирования систем охлаждения и вентиляции, а подсистемы управления и безопасности способны проработать до получаса. Отчасти это заслуга СО, которая потребляет менее 15 % от всей подводимой электроэнергии и которая способна работать в режиме фрикулинга при температуре окружающей среды ниже 15 °C или в гибридном режиме при t < 22°C.
В дальнейшем новый суперкомпьютер СпбПУ планируется использовать не только для внутренних нужд университета, но и предоставлять другим вычислительные мощности системы, что, в общем, тоже немаловажно для окупаемости проекта и рациональности его использования. Во всяком случае, ходят слухи, что некоторые подобные системы большую часть времени простаивают и были запущены на полную мощность лишь несколько раз, да и то только ради того, чтобы отметиться в очередном рейтинге. Конкретно решения РСК прямо сейчас используют и для прикладных задач, и для решения фундаментальных проблем. В основном все они сводятся к моделированию сложных процессов и обработке больших массивов данных. Конкретные примеры – симуляция сложных турбулентных потоков и моделирование деталей высоконагруженных механизмов, изучение генетической регуляции развития организма на молекулярном уровне и создание «живой» вакцины от гриппа, моделирование столкновения галактик и других астрофизических процессов, создание качественных моделей земной атмосферы и океанов, изучение климата и прогнозирование погоды. Проводятся и расчёты задач квантовой химии, обработка и анализ снимков со спутников, а также многое, многое другое.
-
23.04.2024
Не по средствам: большинство госкомпаний не имеет планов и возможностей перейти на отечественное ПО -
23.04.2024
Состоялся релиз новой версии операционной системы Kaspersky Thin Client для тонких клиентов -
23.04.2024
Gartner: затраты в области ЦОД в 2024 году вырастут на 10 % и достигнут $260 млрд
Новости IT бизнеса
- Acer
- Aerocool
- AMD
- APC
- Apple
- Aquarius
- Asrock
- Asus
- AVT
- Blackmagicdesign
- Brother
- Canon
- Chieftec
- Cisco
- Corsair
- Crucial
- D-Link
- Deepcool
- DELL
- Digis
- DOKO
- Eaton
- EDCOMM
- EliteBoard
- ELTEX
- Epson
- EXEGATE
- Fanvil
- Felix
- Foxconn
- Foxline
- FSP
- Fujitsu
- Geckotouch
- Genius
- Gigabyte
- Glacialtech
- Hewlett Packard
- HP
- IBM
- INFOCUS
- Intel
- IQBoard
- ITK
- Juniper
- Kingston
- Kyocera
- Lenovo
- Lenovo Consumer
- Lenovo SMB
- Lexmark
- LG
- Logitech
- Lumien
- Microsoft
- Mikrotik
- MSI
- NVIDIA
- ONEPLUS
- Optoma
- Pantum
- PNY
- Powercom
- Powercool
- Prestigio
- Promobot
- Q-Dion
- QUMO
- Ricoh
- Samsung
- Seagate
- Skilo
- Sony
- STM
- Supermicro
- Thermaltake
- Titan
- Toshiba
- TRIUMPH BOARD
- Ubiquiti
- ViewSonic
- VIVOCOMP
- Wize
- Xerox
- Xiaomi
- Zalman
- Катюша
- Яндекс