AI, 데이터 과학 및 슈퍼 컴퓨팅을 위해 제작 된 PCIe 4.0의 NVIDIA Ampere A100 250W TDP GPU는 400W 모델의 90 % 성능으로 출시되었습니다.

하드웨어 / AI, 데이터 과학 및 슈퍼 컴퓨팅을 위해 제작 된 PCIe 4.0의 NVIDIA Ampere A100 250W TDP GPU는 400W 모델의 90 % 성능으로 출시되었습니다. 2 분 읽기

엔비디아



NVIDIA는 차세대 Ampere 아키텍처를 기반으로 한 PCIe 4.0 호환 GPU 인 A100을 공식적으로 출시했습니다. 더 낮은 250W TDP 프로필을 제공하지만 NVIDIA는 PCIe 4.0 Ampere A100 GPU가 전체 400W A100 HGX GPU 성능의 최대 90 %를 제공 할 수 있다고 약속합니다. 성장하는 Ampere A100 GPU 제품군의 세 번째 변형 인 A100 PCIe는 인공 지능 (AI), 데이터 과학 및 슈퍼 컴퓨팅 클러스터를 실행하는 서버를위한 것입니다.

NVIDIA는 A100 GPU의 PCI-Express 4.0 변형을 공개했습니다. GPU는 7nm 암페어 마이크로 아키텍처를 기반으로합니다. 또한 회사는 Asus, Dell, Cisco, Lenovo 등을 포함한 주요 서버 제조업체의 여러 A100 전원 시스템을 발표했습니다. 250W A100 PCIe 4.0 GPU 가속기는 전체 400W TDP 변형과 매우 유사하며 NVIDIA는 TDP 프로필이 크게 떨어졌음에도 불구하고 거의 동일한 성능을 약속합니다.



동일한 400W A100 HGX GPU 구성을 사용하지만 250W에서 PCIe 4.0 Form-Factor의 NVIDIA A100 암페어 GPU :

NVIDIA는 PCIe 4.0 A100 PCIe GPU 가속기를 발표했습니다. Ampere GPU는 단일 A100 PCIe GPU부터 총 600GB / s의 상호 연결 대역폭을 제공하는 12 개의 NVLINK 채널을 통해 동시에 2 개의 카드를 사용하는 서버에 이르는 다양한 시스템에서 다양한 산업 사용 사례에 사용할 수 있습니다. 250W TDP A100 PCIe GPU 가속기는 400W A100 HGX GPU와 비교할 때 코어 구성 측면에서 많이 변경되지 않습니다.



GA100 GPU는 동일한 메모리 대역폭 1.55TB / s (1.6TB / s로 반올림)를 제공하는 108 개의 SM 장치, 432 개의 Tensor 코어 및 40GB의 HBM2 메모리로 배열 된 6912 CUDA 코어가있는 400W A100 HGX 변형 사양을 가지고 있습니다. 에스). 그러나 GPU 패키지를 PCIe 4.0 표준 TDP를 크게 줄이는 단점이 있습니다. 이는 워크로드에 따라 10 ~ 50 %의 성능 저하를 의미하는 것으로 알려졌습니다. 또한 A100 GPU의 250W TDP 변형은 지속적인 부하보다는 짧은 버스트에 더 적합합니다.

PCIe 4.0 Form-Factor 성능의 NVIDIA A100 Ampere GPU :

TDP 프로파일의 현저한 감소로 인해 카드가 더 적은 TDP 입력을 보상하기 위해 더 낮은 클럭을 특징으로한다고 가정 할 수 있습니다. 그러나 NVIDIA가 발표 한 성능 메트릭은 400W TDP 변형에 매우 가깝기 때문에 정말 놀랍습니다. FP64 성능은 여전히 ​​9.7 / 19.5 TFLOP, FP32 성능은 19.5 / 156 / 312 TFLOP (스파 시티), FP16 성능은 312/624 TFLOP (Sparsity), INT8은 624/1248 TOP ( 희소성).

간단한 수학은 암페어 기반 PCIe 4.0 250W A100 GPU가 상위 서버 애플리케이션에서 A100 HGX 카드 (400W) 성능의 90 %를 제공 할 수 있음을 나타냅니다. 새로운 변형이 위에서 언급 한 작업을 완료하는 데 시간이 덜 걸리기 때문에 이는 정당합니다. 그러나 숫자는 짧은 간격에만 유효해야합니다. 지속적인 GPU 기능이 필요한 복잡한 상황에서 250W PCIe 4.0 GPU는 400W A100 HGX GPU의 성능을 최대 90 %에서 최대 50 %까지 제공 할 수 있습니다.

Ampere 마이크로 아키텍처는 확실히 새로운 A100에 도움이 될 것입니다. NVIDIA는 Volta 기반 이전 제품에 비해 최소 20 배의 성능 향상을 약속합니다. PCIe 4.0 A100 GPU는 다중 인스턴스 GPU 기술을 특징으로합니다. 즉, 단일 A100을 최대 7 개의 개별 GPU로 분할하여 다양한 컴퓨팅 작업을 처리 할 수 ​​있습니다. 이렇게하면 세분화가 향상되지만 여러 GPU를 하나의 거대한 GPU로 결합 할 수있는 3 세대 NVLink가 있습니다.

태그 엔비디아