
챗GPT 개발사인 오픈AI가 그래픽처리장치(GPU) 시장을 독점하고 있는 엔비디아에 대한 의존도를 낮추고 독자적인 인프라 생태계를 구축하기 위해 최초의 맞춤형 인공지능(AI) 반도체를 전격 공개했다.
오픈AI는 글로벌 반도체 설계 기업 브로드컴(Broadcom)과의 긴밀한 기술 협력을 통해 자체 개발한 첫 번째 맞춤형 추론 프로세서 '할라페뇨(Jalapeño)'를 공식 선보였다. 이번 반도체 개발 공정에는 오픈AI가 보유한 최첨단 AI 모델들이 직접 투입되어 칩 설계를 지원했으며, 현재 진행 중인 초기 성능 평가에서 기존 시장의 최고 사양 제품들을 상회하는 압도적인 전력 대비 성능 효율을 증명해 냈다.
양사의 이번 맞춤형 실리콘 개발 프로젝트는 지난해 10월 공식 파트너십을 체결한 이후 철저한 보안 속에 진행되어 왔으며, 빅테크 업계의 고질적인 하드웨어 공급 부족 문제를 해결할 돌파구로 주목받아 왔다. 이미 시장에서는 구글의 TPU나 아마존웹서비스(AWS)의 트레이니움처럼 글로벌 빅테크 기업들이 머신러닝 연산 속도를 극대화하기 위해 자체 전용 칩인 'AI 가속기'를 구축하는 흐름이 대세로 자리 잡은 상태다. 오픈AI 역시 하드웨어 설계 역량을 내재화함으로써 자사 고유의 연산 아키텍처에 최적화된 하부 인프라를 확보하고, 전 세계적으로 폭등하는 데이터센터 가동 비용을 통제할 수 있는 발판을 마련하게 됐다.
이번에 베일을 벗은 할라페뇨 칩은 방대한 대형언어모델(LLM)을 학습시키는 사전 훈련 단계가 아닌, 대중들이 챗GPT 등의 서비스에 명령어를 입력했을 때 실시간으로 답변을 도출해내는 '추론(Inference)' 단계에 특화되어 설계됐다. 특히 오픈AI는 실시간 코딩 제어 모델을 구동할 때 발생하는 운영 비용을 획기적으로 절감할 수 있다는 점을 강조했다. 초고성능 연산이 필요한 인프라 구축에는 여전히 엔비디아의 호퍼나 블랙웰 아키텍처 기반 시스템을 혼용하겠지만, 전 세계 사용자들의 일상적인 질의를 처리하는 추론 비용을 일부라도 줄인다면 회사의 중장기적 재무 구조와 수익성을 개선하는 데 결정적인 기여를 할 것으로 관측된다.
기술 업계에서는 이번 반도체 출시를 계기로 오픈AI가 차세대 자율형 AI 에이전트 제품군을 안정적으로 구동하기 위한 소프트웨어와 하드웨어 통합 수직 계열화를 완성해 나가고 있다고 분석했다. 오픈AI는 프론티어 인공지능 모델 개발과 소비자용 서비스 출시에 머무르지 않고 칩 아키텍처부터 커널, 메모리 시스템, 네트워크 프로토콜, 스케줄링 가동 시스템에 이르는 인프라 전 영역을 직접 설계해 최적화하겠다는 방침이다. 기술 스택의 모든 계층을 하나의 목표에 맞춰 유기적으로 결합함으로써 전 세계 유저들에게 더욱 빠르고 안정적이면서도 이용 가격이 저렴한 서비스 인프라를 제공하겠다는 전략이다.
