DPU, CPU와 GPU에 이어 가속 컴퓨팅의 또 다른 핵심 축 될 것

CPU는 유연성과 대응력이 뛰어나서 수년간 대부분의 컴퓨터에서 프로그래밍 가능한 유일한 요소였다. 그러나, 최근에는 그래픽 처리 장치인 GPU가 컴퓨팅의 중심 역할을 하고 있다. 본래 풍부한 실시간 그래픽을 제공하기 위해 고안됐던 GPU는 병렬처리 능력으로 모든 다양한 컴퓨팅 작업을 가속화하고, 인공지능(AI), 딥 러닝, 빅데이터 분석 애플리케이션을 구축하는데 핵심이 됐다.

CPU와 GPU를 통해 지난 10년간 컴퓨팅은 PC 및 서버를 넘어 하이퍼스케일 데이터센터로 확장됐다. 이러한 데이터센터는 새로운 범주의 강력한 프로세서와 함께 구성된다. 젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 “CPU와 GPU에 이어, DPU(Data Processing Unit)는 데이터 중심 가속 컴퓨팅의 또 하나의 핵심 축이 될 것”이라며, “CPU는 범용 컴퓨팅, GPU는 가속 컴퓨팅을 위한 것이라면, 데이터센터에서 데이터를 이동시키는 DPU는 데이터 처리를 담당한다”고 설명했다.

엔비디아 DGX 슈퍼POD
엔비디아 DGX 슈퍼POD

DPU란 무엇인가

DPU는 새로운 종류의 프로그래밍 가능 프로세서로 주요 특징은 다음과 같다. 

  • 업계 표준의 소프트웨어 프로그래밍 가능 멀티코어 CPU로, 일반적으로 널리 사용되는 Arm 아키텍처를 기반으로 하며 다른 시스템온칩(SoC) 구성요소와 밀접하게 결합된다.
  • 고성능 네트워크 인터페이스로 데이터를 파싱(parsing) 및 처리하고, 데이터를 GPU 및 CPU로 효율적으로 전송한다.
  • 유연하며 프로그래밍 가능한 가속화 엔진으로 인공지능(AI), 머신러닝, 보안, 통신, 스토리지 등을 위한 애플리케이션 성능을 오프로드 및 향상시킨다.

이러한 DPU 기능은 차세대 클라우드 컴퓨팅 환경이 될 베어메탈 방식의 클라우드 네이티브 컴퓨팅을 구현하는 데 매우 중요하다.

SmartNIC에 통합된 DPU

DPU는 독립형 임베디드 프로세서로도 사용 가능하지만, 차세대 서버의 핵심 구성요소인 네트워크 인터페이스 컨트롤러 ‘SmartNIC’에 통합돼 사용되는 경우가 많다. 업계에는 DPU 라고 주장하는 디바이스들이 많이 있지만, 실제로는 DPU를 구성하는 세 가지 핵심 기능 중 중요 요소가 결여된 경우가 많다.

DPU는 독립형 임베디드 프로세서로도 사용 가능하지만, 차세대 서버의 핵심 구성요소인 네트워크 인터페이스 컨트롤러 ‘SmartNIC’에 통합돼 사용되는 경우가 많다.
DPU는 독립형 임베디드 프로세서로도 사용 가능하지만, 차세대 서버의 핵심 구성요소인 네트워크 인터페이스 컨트롤러 ‘SmartNIC’에 통합돼 사용되는 경우가 많다.

 

예를 들어, 몇몇 벤더는 광범위한 Arm CPU 생태계가 제공하는 풍부한 개발 및 애플리케이션 인프라의 이점을 활용하지 않는 독자적인 프로세서를 사용한다. 또한, DPU를 갖췄다고 주장하지만, 데이터 경로 프로세싱을 위해 임베디드 CPU에만 집중하는 오류를 범하는 경우도 있다. 이는 경쟁적이지 않을뿐더러, 확장도 불가능하다. 무모한 성능 향상으로 전통적인 x86 CPU를 뛰어넘으려는 것은 승산이 없다.

대신 네트워크 인터페이스가 모든 네트워크 데이터 경로 프로세싱을 감당할 수 있을 정도로 강력하고 유연해야 한다. 임베디드 CPU는 컨트롤 경로 초기화 및 예외적인 프로세싱을 위해 사용하는 것이 적절하며, 그 이외의 용도는 부적절하다. 다음은 네트워크 데이터 경로 가속화 엔진이 제공할 수 있는 10가지 기능이다.

  • OVS(open virtual switch)를 구현하기 위한 데이터 패킷 파싱·매칭·조작
  • ZTR(Zero Touch RoCE)를 위한 RDMA 데이터 전송 가속
  • CPU를 우회하고 네트워크로 연결된 데이터를 GPU로 직접 전송하는 GPU-다이렉트 가속
  • RSS, LRO, 체크섬(checksum) 등을 포함한 TCP 가속
  • VXLAN와 Geneve 오버레이 그리고 VTEP 오프로드를 위한 네트워크 가상화
  • 멀티미디어 스트리밍, 컨텐츠 배포 네트워크, 새로운 4K 및 8K VoIP(Video over IP) (ST 2110의 경우 RiverMax)를 구현하는 트래픽 셰이핑 패킷 페이싱 가속기
  • 5G를 위한 5T와 같은 텔코 클라우드(telco Cloud) RAN 용 정밀 타이밍 가속기
  • IPSEC 및 TLS에 대한 암호화 가속이 인라인으로 수행되므로 다른 모든 가속이 계속 작동
  • SR-IOV, VirtIO, 반가상화를 위한 가상화 지원
  • 신뢰할 수 있는 루트, 안전한 부팅, 안전한 펌웨어 업그레이드, 인증된 컨테이너·애플리케이션 수명주기 관리 

위의 기능들은 DPU가 무엇인가라는 질문에 대한 답변에 꼭 핵심적으로 들어가야 할 가속·하드웨어 기능 중 열 가지에 불과하다. 소위 DPU의 이름을 딴 많은 장치들이 이런 기능들 중 하나 또는 두 가지만을 제공하는 데 중점을 둔다. 최악의 경우는 독점적 프로세서에서 데이터 경로를 오프로드하려고 한다. 이는 프로토타입 제작에는 좋지만, 데이터센터의 규모, 범위 및 폭에 있어서 의미가 없다.

석대건 기자

daegeon@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

PFCT, 중금리 대출 부실 예측 AI 특허 등록…에어팩 기술 독창성 인정

AI 기술금융사 피에프씨테크놀로지스(PFCT)가 금융 특화 버티컬 AI 인프라 ‘에어팩(AIRPACK)’에 적용한 중금리 대출 부실 리스크 예측 기술로 특허를 등록했다. PFCT는 이번 특허 등록을 통해 에어팩의 핵심 기술 구현 방식과 독창성을 추가로 인정받았다고 30일 밝혔다.

다쏘시스템, 파리상테 캠퍼스와 유럽 소버린 헬스케어 생태계 구축 협력

버추얼 트윈·소버린 클라우드 기반으로 디지털 헬스 스타트업 지원 3D익스피리언스 랩·OUTSCALE 프로그램 연계해 아이디어 단계부터 산업화까지 지원 다쏘시스템이 프랑스 디지털 헬스...

5G냐 LTE냐, 이제 몰라도 된다...통신 3사 '통합요금제' 전환 완료 수순

LGU+가 6월 1일 통합요금제를 선제 출시한 데 이어 KT·SKT도 7월 합류한다. 수백 종 요금제가 16~18종으로 줄고, 월 2만원대 저가 요금제에도 데이터 안심 옵션이 기본 적용된다. 소비자가 알아야 할 핵심 변화 정리.

'메모리 칩 하나로 메타·테슬라 밟았다'…마이크론, AI 광풍에 시총 1.4조 달러 돌파

오래전 PC 성능을 끌어올리려던 이들이 찾던 작은 메모리 카드 제조사가 실리콘밸리의 거대 공룡들을 제치고 섰다. 아이다호주 보이시에 본사를 둔 메모리 반도체 제조업체 마이크론 테크놀로지(Micron Technology)가 6월 25일 장중 시가총액 1조 3980억 달러를 기록하며 메타(Meta)의 1조 3920억 달러와 테슬라(Tesla)를 순간적으로 추월했다.