본문 바로가기 대메뉴 바로가기
open
Close

Super Computing center

인프라

HPC-AI 공용인프라

HPC-AI 공용인프라

  • ‘Dream-AI’
    • SC22 행사에서 발표된 Top500 리스트의 상위권 등재
    • 국내 대학에서 구축‧운영하는 최고 성능의 인공지능 슈퍼컴퓨터
    • 2022년 11월 기준(http://www.top500.org) HPL(고성능 린팩‧High Performance Linpack) 기준으로 3.18페타플롭스(PF)를 기록해 세계 178위에 등재​
  • 외부 네트워킹 및 보안 장비, 컴퓨팅 POD 장비, 데이터연못 스토리지 장비, 공용인프라 서비스 포털 및 운영장비, 패브릭 네트워킹 장비, SandBox-POD 장비의 6가지로 구성됨.

스펙

고성능 컴퓨팅 계산 총 용량 6PF 달성

  • 고성능 GPU 320장을 제공하도록 GPU 기반 고성능 AI컴퓨팅 노드 20 + 20대씩으로 구성되는 컴퓨팅 A-POD와 B-POD 도입을 통한 고성능 컴퓨터 클러스터

고성능 스토리지 총 용량 10PF 달성

  • 병렬파일 시스템이 적용된 1PB(전체 대비 10%) 규모의 All-Flash NVMe SSD 스토리지와 9 PB 규모의 SAS HDD 기반 스토리지로 구성된 총 10PB 규모 데이터연못 스토리지 클러스터 구축
  • IOR 실측성능 기준 Flash RW 150GB/s, SAS RW 80GB/s 이상 - 네트워크: 200Gbps 이상 지원

초고속 패브릭 네트워크 및 보안 구축

  • Non-Blocking 구조의 Muilti-Node 활용 환경, 관리 NW 별도 구성
  • Node-to-Node 800Gbps 이상
  • Node-to-Storage 200Gbps 이상
  • 모든 네트워크 구성(서버, 스토리지)은 이중화 환경을 고려하여 설계
  • 네트워크 구간 레이턴시 최소화를 위하여 IB사용시 V2케이블 사용
  • 경계 라우터 및 방화벽 10G 이상
  • 외부 사용자 접근시 한쪽 로그인 시스템 편중을 막기 위한 접근 제어기능 제공
  • 경계 라우터 및 방화벽 10G 이상
  • 외부 사용자 접근시 한쪽 로그인 시스템 편중을 막기 위한 접근 제어기능 제공
  • 통합관제타워를 통한 원격 인프라 운영을 위한 관리 네트워크로 각각 구분하여 구축
A Pod
A Pod
B Pod
B Pod
DataPod
DataPod
Fabric
Fabric

HPC-AI 공용인프라 제원

HPC-AI 공용인프라 제원 - NVIDIA HGX용 NVIDIA A100 SXM4 정보제공
NVIDIA HGX용 NVIDIA A100 SXM4
GPU 아키텍쳐 NVIDIA Ampere
배정밀도 성능
  • FP64: 9.7 TFLOPS
  • FP64 Tesor 코어: 19.5 TFLOPS
단정밀도 성능
  • FP32: 19.5 TFLOPS
  • Tesor Float 32 (TF32): 156 TFLOPS | 312 TFLOPS*
반정밀도 성능 312 TFLOPS | 624 TFLOPS*
Bfloat16 312 TFLOPS | 624 TFLOPS*
정수 성능
  • INT8: 624 TOPS | 1,248 TOPS*
  • INT4: 1,248 TOPS | 2,496 TOPS*
GPU 메모리 40 GB HBM2
메모리 대역폭 1.6 TB/sec
오류 정정 부호 Yes
인터커넥트 인터페이스 PCIe Gen4: 64 GB/sec 3세대 NVIDIA® NVLink®: 600 GB/sec**
폼 팩터 NVIDIA hGX™ A100에 있는 4/8 SXM GPU
멀티-인스턴스 GPU (MIG) 최대7 GPU 인스턴스
최대 전력 소비 400 W
Delivered Performance for Top Apps 100%
쿨링 솔루션 패시브 (Passive)
컴퓨팅 API CUDA®, DirectCompute, OpenCL™, OpenACC®

구조적 희소성 사용

HGX A100 서버 보드를 사용한 SXM GPU; 최대 2 GPU까지 NVLink Bridge를 사용한 PCIe GPU

HPC-AI 공용인프라 구성
HPC-AI 공용인프라 구성
HPC-AI 공용인프라 Rack 구성 장비 배치
HPC-AI 공용인프라 Rack 구성 장비 배치
QUICK
MENU
꿈꾸는 아이꿈꾸는 아이 Ai 대학원Ai 대학원 GIST 대표GIST 대표