AI 시대를 향해 진화를 거듭하고 있는 데이터센터 기술

데이터 경제 시대 인공지능(AI)의 중요성이 커지는 만큼 미래 데이터센터 전략을 잘 수립하는 것은 기업의 미래 가치를 높이는 중요 투자가 될 전망이다. '클라우드와 함께 AI 데이터센터 전략을 어떻게 가져가느냐'에 많은 산업이 승패가 갈릴 것이다. 

데이터센터 아키텍처의 변화

기업의 데이터센터는 빠른 속도로 소프트웨어 정의 기반 아키텍처로 진화 중이다. 모노리틱(monolithic) 아키텍처 방식으로 소프트웨어 스택을 쌓던 시절의 데이터센터는 서버, 스토리지, 네트워크 등의 장비가 각각의 요소로 구축되어 운영되었다. 

하지만 2021년의 모습은 크게 다르다. 많은 하드웨어 자원이 가상화되었고, 이 위에 가상 머신과 컨테이너 플랫폼이 운영되고 있다. 그리고 우리 예상보다 빠르게 소프트웨어 환경은 마이크로서비스 아키텍처로 전환될 전망이다. 

이것이 뜻하는 것은 무엇일까? 데이터센터 내의 자원과 서비스(애플리케이션)의 이동성(mobility)이 크게 높아졌다는 것이다. 관리 역시 추상화 수준이 높긴 하지만 중앙 집중적으로 데이터센터 전체를 아우를 수 있고, 필요에 따라 하이브리드 멀티 클라우드 전략에 따라 관리 대상을 확대할 수도 있다. 

여기에 한 가지 더하자면 AI와 데이터 그리고 클라우드 우선 전략을 앞세우는 기업이 늘면서 기존 CPU 중심적인 구조에서 벗어나 GPU와 DPU 기반 인프라를 조성하는 것이 미래 데이터센터 전략의 핵심으로 부상 중이다. 

 

GPU·DPU에서 데이터센터의 미래를 찾는 이유

그렇다면 GPU, DPU는 구체적으로 어떤 역할을 할까? 먼저, CPU는 모든 회로를 단일 마이크로 프로세서 칩에 통합할 수 있게 된 이후로, 말 그대로 수십 년 동안 컴퓨팅의 핵심이었다. CPU는 애플리케이션 처리와 그 안에 포함된 비즈니스 로직을 처리한다. 

그래픽 처리 장치 (GPU)는 머신 러닝, 분석 및 고급 그래픽과 같은 애플리케이션의 부동 소수점 계산 처리를 가속화한다. 그렇다면, DPU는 어디에 적합할까?

기업의 데이터센터 인프라와 플랫폼 구조는 앞서 언급한 바와 같이 모든 인프라 요소가 가상화되고 있고, 이를 소프트웨어 정의 기반 방식으로 제어하고 활용한다. 여기에 소프트웨어 개발, 배포, 운영은 마이크로서비스 아키텍처 방식으로 전환하고 있다. 그리고 개발, 운영이 분리되던 시절과 달리 대다수 조직이 DevOps를 지향하고 있다. 

이런 변화가 뜻하는 것은 데이터센터 내 트래픽(East-West)이 급증한다는 것이다. 주요 애플리케이션이 마이크로서비스 단위로 나누어지고, 각각의 서비스 단위가 매우 빈번하게 API 호출을 하는 환경을 떠올리면 이해가 될 것이다. 데이터센터 내부의 데이터 트래픽이 어마어마하게 증가할 수밖에 없다. 

이를 데이터센터 관점에서 해결할 수 있는 방안이 바로 데이터 처리 장치(DPU, Data Processing Unit)다. NVIDIA의 BlueField DPU는 데이터센터 인프라 프로세싱이라는 새로운 개념을 제시한다. 

DOCA의 등장

BlueField DPU는 데이터센터 인프라에 가해지는 부하를 매우 효과적으로 오프로드하며 트래픽 처리를 가속한다. 문제는 이 혜택을 현재 운영 중인 앱이나 서비스까지 누릴 수 있게 하는 것이다. 

이에 대한 NVIDIA의 답이 바로 DOCA다. 현재 1.0 버전이 출시된 DOCA는 BlueField DPU를 위한 SDK다. 이를 사용하면 소프트웨어 개발자는 업계 표준 API를 이용해 BlueField DPU의 기능을 활용하는 애플리케이션과 서비스를 신속하게 만들 수 있다. 참고로 DOCA는 DPDK (Data Plane Development Kit), 스토리지를 위한 SPDK (Storage Performance Development Kit) 등 업계 표준 API와 프레임워크를 제공한다. 

한편, NVIDIA는 DOCA의 더 많은 이들이 활용할 수 있도록 생태계 조성에도 힘을 쓰고 있다. 현재 소프트웨어 정의 인프라, 스토리지, 사이버 보안 및 엣지 컴퓨팅 등 다양한 부문의 업체가 생태계 일원으로 참여하고 있다. 

NVIDIA는 최근 열린 GTC 2021에서 최신 제품인 BlueField DPU-3을 공개했다. 220억 개의 트랜지스터와 동일한 처리 능력에 400Gbps 급 네트워킹 칩 등 높은 사양을 제공한다. 내장된 Arm CPU 코어는 VMware ESX 실행에 충분한 성능을 제공한다. 내장 보안 기능도 뛰어나 IPSec, TLS 암호화, 키 관리 같은 많은 자원을 필요로 하는 작업의 오프로딩도 훌륭히 수행한다. 

앞에서 살펴본 바와 같이 데이터센터는 AI 시대를 향해 빠르게 진화 중이다. 그리고 현재 이 트렌드를 이끄는 주역은 다름 아닌 NVIDIA다. 앞으로 NVIDIA의 기술 로드맵을 주목해야 하는 이유다.

김성태

sungtai@uclick.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

형편없는 글 솜씨 때문에 직장생활이 힘겹다면?

비즈니스 글쓰기는 다릅니다. 기본적인 3가지 원칙을 지켜 반복 훈련하면 글 솜씨를 훨씬 발전시킬 수 있는데요. 그럼 상사 속 터지게 만드는 대표적인 비즈니스 글 3가지 유형을 살펴보고, 이런 글을 쓰지 않기 위해 명심해야 할 세 가지 원칙을 확인해볼까요?

티빙은 왜 한국프로야구 온라인 중계권을 샀을까?

왜 티빙은 3년 계약에 1,300억이 넘는 큰 금액을 투자해서 이 권리를 구매했을까요? 3년에 1,300억은 1년에 400억이 훨씬 넘는 금액을 투자한 것인데 그만큼의 가치가 있는걸까요? 기존에 온라인 중계권을 가지고 있던 네이버와 통신사 등의 컨소시엄보다 더 큰 금액을 투자해서 티빙은 무엇을 얻고자 하는걸까요? 

일론 머스크의 예측, 실현 가능성은?

일론 머스크는 위와 같이 AGI 즉 '범용 인공지능이 가장 똑똑한 인간보다 더 똑똑하다는 것으로 정의한다면, 2년 이내에 가능하게 될 것'이라고 언급했다.

잡스가 늘 직원들을 닦달한 말? “일 좀 벌이지 마!”

그런데 다들 ‘해야 할 일’에 집착할 때, 오히려 ‘하지 않아도 될 일’을 쳐내는데 집중한 사람이 있습니다. 바로 스티브 잡스인데요. 그는 늘 구성원들에게 "일 좀 벌이지 마!"라고 소리쳤다는데요. 대체 왜 그랬을까요?