HPE, 미국 아르곤 국립연구소에 슈퍼컴퓨터 ‘Aurora’ 제공
  • 최종윤 기자
  • 승인 2024.05.26 08:30
  • 댓글 0
이 기사를 공유합니다

엑사플롭 컴퓨팅 수준을 넘어선 세계에서 두 번째로 빠른 시스템

[인더스트리뉴스 최종윤 기자] HPE가 현지시간으로 지난 13일 미국에서 열린 ‘국제 슈퍼컴퓨팅 컨퍼런스(ISC High Performance 2024, ISC 2024)’에서 미국 에너지부 산하 아르곤 국립 연구소(Argonne National Laboratory)에 인텔과 협력해 세계 두 번째 엑사스케일 슈퍼컴퓨터 오로라(Aurora)를 공급했다고 발표했다.

HPE가 미국 에너지부 산하 아르곤 국립 연구소(Argonne National Laboratory)에 인텔과 협력해 세계 두 번째 엑사스케일 슈퍼컴퓨터 오로라(Aurora)를 공급했다. [사진=HPE]

오로라는 시스템의 87%만 가동한 상태에서 1.012 엑사플롭(exaflop)에 도달하며 가장 강력한 슈퍼컴퓨터 차트인 ‘TOP500’에서 검증된 전 세계 두 번째로 빠른 슈퍼컴퓨터로 등재됐다.

또한 슈퍼컴퓨팅 분야의 세계적 리더 HPE의 오로라는 HPE가 두 번째로 제작한 엑사스케일 시스템일 뿐만 아니라 세계 최대의 인공지능 지원(AI-capable) 시스템으로 HPC 및 AI 워크로드 처리 성능을 측정하는 HPL 혼합 정밀도(Mixed-Precision, MxP) 벤치마크에서 전체 시스템의 89%만을 가동한 상태에서 10.6 엑사플롭을 달성하며 1위를 차지했다.

트리시 댐크로거(Trish Damkroger) HPC 및 AI 인프라 솔루션 담당 수석 부사장 겸 총괄은 “오로라는 세계가 당면한 가장 어려운 문제들을 해결하고 획기적인 과학 기술을 발견하기 위한 대규모 컴퓨팅 역량을 제공할 수 있으며, 이러한 오로라를 통해 엑사스케일 컴퓨팅에 또 하나의 이정표를 만들어갈 수 있게 되어 매우 영광”이라며, “HPE는 미국 에너지부, 아르곤 국립 연구소, 그리고 인텔과의 견고한 파트너십을 통해 이러한 대규모 수준의 시스템을 현실화할 수 있게 된 점을 자랑스럽게 여기고 있다”고 밝혔다.

엑사스케일 컴퓨팅 시스템은 초당 100경회의 작업을 처리할 수 있어, 이러한 대규모 컴퓨팅 역량을 통해 인류가 당면한 가장 어려운 문제들을 해결해 나갈 수 있다. 오로라는 엑사스케일의 엄청난 규모와 범위를 지원할 수 있도록 특별히 설계된 HPE 크레이 EX 슈퍼컴퓨터(HPE Cray EX supercomputer)로 구축됐다.

또한, 오로라는 단일 시스템으로는 개방형 이더넷 기반 슈퍼컴퓨팅 인터커넥트 솔루션인 HPE 슬링샷(HPE Slingshot)이 최대 규모로 배포된 시스템이기도 하다. 이러한 패브릭 시스템은 오로라의 컴퓨팅 노드 엔드포인트 75,000개, 2,400개의 스토리지 및 서비스 네트워크 엔드포인트를 5,600개의 스위치와 연결한다.

이를 통해 오로라의 컴퓨팅 블레이드 10,624개, 인텔 제온 CPU 맥스 시리즈 프로세서(Intel Xeon CPU Max Series Processor) 21,248개 및 인텔 데이터 센터 GPU 63,744개 유닛 전반에 걸쳐 고속 네트워킹을 지원함으로써 성능을 향상시켜 주는 세계 최대 GPU 클러스터 중 하나다.

초기 설계 단계부터 AI 지원 시스템으로 개발된 오로라를 기반으로 연구원들은 생성형 AI 모델을 구동함으로써 과학 발전을 더욱 가속할 수 있게 되었다. 일례로 과학자들은 인간 두뇌 속 800억 개의 뉴런에 대해 더 깊이 연구하기 위한 브레인 매핑(Brain mapping, 뇌 지도화) 연구, 딥러닝을 활용한 고에너지 입자 물리학, 머신 러닝 기술을 통한 신약 설계 및 개발 등 오로라를 활용해 초기 AI 기반 연구를 진행한 바 있다.

저명 연구학자인 릭 스티븐스(Rick Stevens) 아르곤 국립 연구소 부연구실장은 “오로라는 독자적인 역량을 자랑하는 슈퍼컴퓨터로 연구원들을 위한 게임체인저 역할을 할 것으로 기대한다”면서, “미국 내 초단위 엑사스케일 시스템이라는 새로운 이정표를 새긴 것은 엄청난 성과이며 전 세계 공동의 과학적 이니셔티브를 한층 더 발전시켜줄 것”이라고 말했다.

오로라 엑사스케일 슈퍼컴퓨터는 HPE, 인텔, 미국 에너지부, 아르곤 국립 연구소간 구축된 견고한 파트너십의 결과로, 혁신 엔지니어링 기술로 과학 기술 발전에 이바지하기 위해 공동 투자 및 협력을 진행했다.

오로라 초기 과학 프로그램(Aurora Early Science Program)을 통해 입증된 바와 같이 민관 부문의 파트너십은 과학 기술 진보를 위해서 필수적이다. 나아가, 연구원들은 오로라 시스템의 최적화 및 스트레스 테스트(stress-test) 과정의 일환으로 이미 다양한 프로그래밍 모델, 언어 및 애플리케이션을 시스템에서 성공적으로 실행했다.

오로라는 전체 노드 중 9,234개의 노드를 활용한 시스템 부분 실행에서 엑사스케일 컴퓨팅 수준을 달성했으며, 미국 에너지부 과학국 내 이용자 시설인 아르곤 리더십 컴퓨팅 시설(Argonne Leadership Computing Facility, ALCF)에 구축된 개방형 과학 시스템이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.