NVIDIA HGX용 NVIDIA A100 SXM4 | |
---|---|
GPU 아키텍쳐 | NVIDIA Ampere |
배정밀도 성능 |
|
단정밀도 성능 |
|
반정밀도 성능 | 312 TFLOPS | 624 TFLOPS* |
Bfloat16 | 312 TFLOPS | 624 TFLOPS* |
정수 성능 |
|
GPU 메모리 | 40 GB HBM2 |
메모리 대역폭 | 1.6 TB/sec |
오류 정정 부호 | Yes |
인터커넥트 인터페이스 | PCIe Gen4: 64 GB/sec 3세대 NVIDIA® NVLink®: 600 GB/sec** |
폼 팩터 | NVIDIA hGX™ A100에 있는 4/8 SXM GPU |
멀티-인스턴스 GPU (MIG) | 최대7 GPU 인스턴스 |
최대 전력 소비 | 400 W |
Delivered Performance for Top Apps | 100% |
쿨링 솔루션 | 패시브 (Passive) |
컴퓨팅 API | CUDA®, DirectCompute, OpenCL™, OpenACC® |
구조적 희소성 사용
HGX A100 서버 보드를 사용한 SXM GPU; 최대 2 GPU까지 NVLink Bridge를 사용한 PCIe GPU