Nvidia, 완전한 AI 및 HPC 소프트웨어 스택으로 ARM CPU 지원 확장

하드웨어 / Nvidia, 완전한 AI 및 HPC 소프트웨어 스택으로 ARM CPU 지원 확장 4 분 읽기

엔비디아 암페어



오늘 초 Nvidia는 마침내 전체 AI 및 HPC 소프트웨어 스택과 함께 ARM 아키텍처가있는 프로세서에 대한 지원을 발표했습니다. Nvidia는 휴대용 게임, 자율 주행 차량, 로봇 공학 및 임베디드 AI 컴퓨팅을 위해 Tegra 칩 및 기타 시스템 온 칩 제품에 아키텍처를 통합했기 때문에 ARM에 대해 잘 알고 있습니다.

왜 지금?

ARM은 한동안 사용되었지만 HPC 시스템에서 사용되는 것은 몇 년 전까지는 존재하지 않았습니다. 거의 모든 HPC 시스템은 오랜 시간 동안 Intel의 칩을 사용하여 뛰어난 레거시 소프트웨어 및 라이브러리 지원을 제공합니다.



수년 동안 ARM은 아키텍처를 x86 칩의 실행 가능한 대안으로 만들 수있는 생태계를 구축하기 위해 지칠 줄 모르고 노력해 왔습니다. Mont-Blanc 프로젝트는 이러한 방향에서 큰 이니셔티브였습니다.



Mont-Blanc 파트너는 Arm 소프트웨어 에코 시스템을 만들기 위해 32 비트 휴대폰 기술과 이식 및 튜닝 소프트웨어 및 도구를 기반으로 Arm HPC 테스트 시스템을 처음부터 구축해야했습니다. 2015 년에 Mont-Blanc은 2,000 개 이상의 모바일 CPU를 특징으로하는 세계 최초의 Arm 기반 HPC 클러스터를 배포했습니다. 이 시스템은 HPC에 Arm 기술 사용의 실행 가능성을 입증하는 데 도움이되었습니다.



- OAG

이러한 이니셔티브는 마침내 결실을 맺고 있으며 ARM 아키텍처를 갖춘 칩은 전 세계의 다양한 HPC 시스템에서 점점 더 많이 사용되고 있습니다.

데이터 센터에 대한 Nvidia의 비즈니스 관심사

Nvidia는 이미 소비자 GPU 비즈니스의 많은 부분을 장악하고 있으며 수년에 걸쳐 워크 스테이션을위한 훌륭한 하드웨어 및 소프트웨어 스택을 만들었습니다. 소프트웨어 측면에는 AI 및 딥 러닝 워크로드와 관련된 많은 솔루션이 있습니다. 이러한 모든 워크로드는 GPU로 가속화 될 수 있으며 여기에서 Tesla 및 Volta GPU가 사용됩니다.



이것은 회사의 재정에 도움이되었으며 Fobes 작성자 : Karl Freund ' NVIDIA의 2019 년 1 분기 분기에 회사는 다시 한 번 기대치를 초과하여 총 수익이 66 % 증가했으며, 핫한 데이터 센터 비즈니스의 71 % 성장 (분기에 7 억 1 천만 달러에 도달)을 포함했습니다. NVIDIA의 경우 '데이터 센터'부문에는 HPC (고성능 컴퓨팅), 데이터 센터 호스팅 그래픽 및 AI 가속이 포함됩니다. '

이는 Nvidia의 투자자 기조 연설에서도 중요한 이야기입니다. Nvidia가 Mellanox를 인수 한 후 여기 , CEO Jensen Huang은“ 이 전략은 데이터 센터를 두 배로 늘리고 있으며 고성능 컴퓨팅 기술의 두 리더를 결합하고 통합하고 있습니다. 우리는 고성능 컴퓨팅을위한 가속 컴퓨팅에 중점을두고 있으며 Mellanox는 고성능 컴퓨팅을위한 네트워킹 및 스토리지에 중점을두고 있으며 두 회사를 한 지붕 아래에서 결합했습니다. 우리의 비전은 데이터 센터가 오늘날 세계에서 가장 중요한 컴퓨터이며, 미래에는 워크로드가 계속 변경됨에 따라 (인공 지능 및 데이터 분석에 의해 실제로 촉발 됨) 모든 종류의 미래 데이터 센터가 고성능처럼 구축 될 것이라는 것입니다. 컴퓨터. 수십억 명의 사람들에게 서비스와 경량 컴퓨팅을 제공하기 위해 하이퍼 스케일 데이터 센터가 실제로 만들어졌습니다. 그러나 지난 몇 년 동안 인공 지능과 기계 학습 및 데이터 분석의 출현으로 데이터 센터에 많은 부하가 가해졌습니다. 그 이유는 데이터 크기와 컴퓨팅 크기가 너무 커서 하나에 맞지 않기 때문입니다. 컴퓨터. 따라서 여러 대의 컴퓨터에 배포해야하며 이러한 컴퓨터가 함께 작동 할 수 있도록하는 고성능 연결이 점점 더 중요 해지고 있습니다. 이것이 Mellanox가 잘 성장한 이유이며 사람들이 SmartNIC와 지능형 패브릭 및 소프트웨어 정의 네트워크에 대해 이야기하는 이유입니다. 이러한 모든 대화는 동일한 장소로 이어지며, 데이터 센터가 일관된 거대한 컴퓨팅 엔진이되어 많은 사람들이 여전히 공유 할 수 있지만 소수의 사람들이 매우 큰 애플리케이션을 실행할 수있는 미래입니다. 그들에게도. 데이터 센터의 미래에는 컴퓨팅이 서버에서 시작 및 종료되지 않고 네트워크로 확장되고 네트워크 자체가 컴퓨팅 패브릭의 일부가 될 것이라고 믿습니다. 장기적으로는 데이터 센터 규모의 컴퓨팅 아키텍처를 만들 수있는 능력이 있다고 생각합니다. '

ARM, 성공을위한 준비

ARM 칩은 전 세계 대부분의 모바일 장치에 전력을 공급하므로 아키텍처는 설계 상 전력 효율성을 유지합니다. 아키텍처가 라이센스 아웃되었으므로 ARM을 사용하면 여러 실리콘 제조업체를 고려할 수 있습니다.

전력 소비는 HPC의 큰 관심사로 남아 있으며 ARM을 사용하면이 문제를 크게 상쇄 할 수 있습니다. 소프트웨어를 사용하더라도 Mont-Blanc 프로젝트를 통해 ARM을 위해 많은 과학 라이브러리와 도구가 개발되었으며 이는 전체 생태계를 발전시키는 데 큰 역할을합니다.

HPC 및 데이터 센터에서 ARM의 사용은 x86 시스템에 비해 여전히 적지 만 Nvidia는 여기에서 잠재력을보고 있습니다. 경쟁자 인 AMD는 또한 EPYC 서버 프로세서 및 Radeon Instinct GPU 가속기로 HPC 및 데이터 센터 시장에서 치열한 경쟁을 시작했습니다. 따라서 Nvidia가 지금 ARM을 채택하고 소프트웨어 제품군 (CUDA-X HPC 등)을 제공하는 것이 중요합니다. 일부 제조업체와 달리 Nvidia는 CPU를 만들지 않으므로 AMD와 Intel이 제공 할 수있는 CPU-GPU 일관성이 없습니다.

돌이켜 보면 Nvidia는 다음과 같이 ARM과의 파트너십을 강화할 수 있습니다. NextPlatform “ Nvidia와 Arm은 파트너십을 체결하여 Neoverse 라이선스를 구매 한 사람들이 NVLink IP 블록을 사용할 수 있도록함으로써 CPU-GPU 컴퓨팅 컴플렉스 전반에 걸친 메모리 원자 및 메모리 일관성을 포함하여 GPU와의 긴밀한 결합을 허용 할 수 있습니다. '

이러한 움직임은 x86 HPC에 대한 실행 가능한 아키텍처 대안으로서 ARM의 경우에 확실히 도움이 될 것입니다. AMD가 Radeon Instinct GPU를 계속 공격적으로 추진함에 따라 향후 언젠가 AMD에서 유사한 움직임을 기대할 수 있습니다.

태그 팔 엔비디아