2025 미중 AI전쟁···오픈AI이어 엔비디아까지 넘나?

지난해 세계 AI기술 톱 10 순위는 미국, 중국, 영국 등의 순이었다. 2025년에는 중국의 딥시크를 비롯한 AI모델업체와 화웨이의 강력한 AI칩 양산 계획 등으로 미국의 1위가 더욱더 위협받는 상황을 맞고 있다. (자료=테코피디아)

올초 딥시크가 세계최고로 여겨지는 미국 오픈AI의 챗GPT-o1과 맞먹는 수준의 성능을 보이는 모델을 내놓으면서 전세계에 충격을 던졌다. 하지만 아직 중국발 AI충격은 진행중인 것 같다. 올연말이면 화웨이가 여전히 세계최고 AI칩인 엔비디아 H100을 능가하는 어센드(Ascend) 910C를 140만개나 내놓을 계획이기 때문이다. 섣불리 결과를 판단하긴 이르지만 중국의 AI 세계 제패 야심이 무서운 속도로 실행되고 있는 것이 보이는 듯 하다. 딥시크 쇼크 때문에 미중 AI전쟁에서 다소 잊혀진 듯한 부분이 중국의 AI칩 굴기다. 중국은 이제 AI모델을 훈련시킬 AI칩 독립을 향해 나가고 있다. 그 상황을 엔비디아칩 사양, 세계최고 AI관련 칩 기술과 중국과의 격차, 중국의 경계할 만한 AI칩 기업, 중국 AI칩 굴기 전략, 최근 시진핑의 AI분야 독려 분위기에 이르기까지 함께 알아봤다. 더레지스터, AI스트래티지, 미 정보기술 및 혁신재단(ITIF)보고서 등을 참고했다.

미국 엔비디아 칩이 시장을 선도한다

중국 딥시크의 AI모델은 약 2000개의 엔비디아의 최고급 AI칩 성능을 낮춘 H800 GPU(사진)로 학습된 것으로 알려졌다. (사진=엔비디아)

미국은 여전히 ​​AI 칩 제조에서 1위이다. 딥시크는 AI 세계를 뒤흔들었다. 그러나 A100이라는 성능이 낮은 AI 칩에만 접근할 수 있었다. 어떤 경우에는 H800 칩을 사용했다. 성능 지표가 포함된 전체 엔비디아 칩 목록은 엔비디아 블랙웰 아키텍처,엔비디아 호퍼 아키텍처, 엔비디아 A100 텐서 코어 GPU, 엔비디아 RTX 시리즈(예=RTX A6000)를 꼽을 수 있으며 제조공정과 성능은 아래와 같다.

①엔비디아 블랙웰 아키텍처

▲트랜지스터 수=2080억 개

▲제조 공정=맞춤형 4나노 프로세스 TSMC 공정

▲칩-투-칩 링크=10테라바이트(10TB,1테라=1조)/초

▲성능=최대 10조 개의 매개변수를 확장하는 모델에 대한 AI 학습 및 실시간 추론 지원

▲주요 기능=마이크로 텐서 확장을 지원하는 2세대 트랜스포머 엔진, GPU당 1.8TB/초의 양방향 처리량을 제공하는 5세대 NV링크로 최대 576개 GPU 간 원활한 통신 가능, 시스템 가동 시간과 진단을 향상시키는 RAS(Reliability, Availability, Serviceability) 엔진, 모델과 데이터를 보호하기 위한 안전한 AI 기능

②엔비디아 호퍼 아키텍처

▲트랜지스터 수=약 800억 개의 트랜지스터(구체적인 수는 모델에 따라 다를 수 있음)

▲제조 공정=TSMC의 5나노미터 공정 기술

▲성능=고성능 컴퓨팅 및 AI 워크로드를 위해 설계됐으며 됐으며 대규모 모델을 지원한다.

▲주요 기능=딥 러닝 작업에 최적화된 고급 텐서 코어, 더 빠른 데이터 액세스를 위한 고대역폭 메모리(HBM3), 다중 인스턴스 GPU 기술 지원으로 단일 칩에서 여러 네트워크를 동시에 실행할 수 있음

③엔비디아 A100 텐서 코어 GPU

▲트랜지스터 수=540억 개의 트랜지스터

▲메모리 구성=최대 80GB의 HBM2 메모리

▲성능=싱글프리시전(FP32) 성능=최대 19.5테라플롭스(19.5TFLOPS, 1테라플롭스=초당 1조회 부동 소수점 연산 속도)

▲하프프리시전(FP16) 성능=최대 156TFLOPS

▲INT8(8비트 정수 정밀도) 성능=최대 624TOPS(Tera Operations Per Second)(INT8은 8비트를 사용하는 고정 소수점 표현으로, 값은 부동 소수점 숫자가 아닌 정수다. INT8 정밀도는 FP32보다 속도와 메모리 사용량을 최대 4배, FP16보다 최대 2배까지 향상시킬 수 있다.)

▲주요 기능=단일 GPU에서 여러 워크로드를 지원하는 다중 인스턴스 GPU 기술, 최대 1555GB/초(1GB=10억바이트) 메모리 대역폭을 제공하는 고대역폭 메모리 인터페이스,

④엔비디아 RTX 시리즈(예=RTX A6000)

▲트랜지스터 수=약 280억 개의 트랜지스터(A6000의 경우)

▲메모리 구성=최대 48GB GDDR6 메모리

▲성능=FP32의 경우 약 38.7 TFLOPS, 실시간 레이 트레이싱 및 AI 기반 작업을 위한 레이 트레이싱 코어 및 텐서 코어.

▲주요 기능=실시간 레이 트레이싱(광선추적)을 위한 하드웨어 지원 기능과 DLSS(Deep Learning Super Sampling)를 통한 AI 강화 그래픽 기능이다. (실시간 광선 추적은 장면에서 빛이 물체에 반사돼 사실적인 이미지를 만드는 방식을 시뮬레이션하는 렌더링 기법이다. 비디오 게임 및 기타 그래픽 애플리케이션에 사용된다.)

중국 AI 칩 기술, 글로벌 리더에 2년 뒤처져

미중 AI전쟁이 한창인 가운데 미국 싱크탱크인 정보기술 및 혁신재단(ITIF)가 본 미국과 중국의 주목할 만 한 로직칩 공급업체들. 미국 AI칩을 위협할 중국 AI칩 관련업체로는 하이곤(Hygon Information Technology·海光信息技术股份有限公司), 중국 최대 GPU업체인 징지아 마이크로(Jingjia Microelectronics·景嘉微), 인플레임 테크놀로지(Enflame Technology·燧原科技), 바이두(百度), 디피(DeePhi·深鉴科技), 하이실리콘(화웨이 자회사), 캠브리콘 테크놀로지스(Cambricon Technologies·中科寒武纪科技股份有限公司), AI칩 업체 호라이즌 로보틱스(Horizon Robotics·地平线), AI유니콘인 인텔리 퓨전(Intellifusion·云天励飞)이 거론됐다. (자료=ITIF. 2024.8.26.)

AI 칩 기술 분야에서 중국의 위치는 복잡하며 산업의 여러 측면에 따라 다르다.

화웨이가 AI칩 어센드 910C를 발표한 지난해 8월, 미국 싱크 탱크인 정보기술및혁신재단(ITIF)의 보고서에 따르면 중국의 칩 설계 및 제조 역량은 미국과 동맹국에 크게 뒤처져 있다는 평가를 받았다. 그러나 중국 정부와 화웨이의 계획대로라면 올연말까지 엔비디아의 최고성능 AI칩인 H100의 성능을 능가하는 어센드 910C칩을 140만개 수준으로 양산할 계획이다.

ITIF보고서에 따르면 반년전 중국기업의 반도체 기술 실력은 다음과 같다.

칩 설계에서 중국 기업은 로직 칩의 글로벌 리더보다 약 2년 뒤처지고, 메모리 칩의 경우 몇 년 더 뒤처진다. (반도체 전문 시장조사업체 테크인사이츠는 지난달 중국 온라인 유통시장에 올라온 중국산 DDR5 D램 모듈을 확보해 분석한 최근 보고서에서 “(지난해말 온라인에 등장한) ‘중국산 더블데이터레이트5(DDR5) D램으로 만든 32GB 모듈’은 중국 창신메모리테크놀로지(CXMT)의 16Gb(기가비트) DDR5 D램 16개로 구성됐다. CXMT의 최신 16나노미터(nm) ‘G4’ D램 기술이 적용됐다”고 밝혔다. CXMT가 사용한 것으로 보이는 16nm G4는 삼성전자와 SK하이닉스가 2021년 본격 양산한 10나노 3세대(1z·15.8~16.2nm) 공정과 같기에 이 결과대로라면 한국삼성전자 SK하이닉스와 CXMT의 D램 기술 격차가 3년으로 좁혀졌다는 분석이 가능하다.)

반도체 제조 장비의 경우 중국은 5세대 뒤처질 수 있다.

첨단 칩 제조 공정 측면에서 중국의 선도적 칩 제조업체인 SMIC는 2022년에야 14nm 칩의 대량 생산을 시작하면서 글로벌 리더보다 1~2세대 뒤처졌다. 대만의 국가과학기술위원회(國家科學及技術委員會)에 따르면 SMIC는 TSMC와 비교했을 때 최소 10년 뒤처졌다. 최근 분석에 따르면 약 3년 뒤처졌다.

AI 칩 역량의 격차는 첨단 칩 제조 장비 및 설계 도구에 대한 미국의 수출 통제에 영향을 받는다. 미국의 이러한 대중 AI칩 수출 제한은 중국을 하이엔드 칩 생산에서 10~15년 뒤처지게 하는 것을 목표로 한다.

어려움 속에서도 중국은 AI 모델 개발에서 상당한 진전을 이루었다. 일부 중국 AI 모델은 현재 미국의 최고 오픈소스 모델과 경쟁하고 있지만 여전히 최고의 폐쇄형 모델보다 약 1년 뒤처져 있다. 그러나 AI 모델은 점점 더 많은 컴퓨팅 파워가 필요한다. 칩 제한은 중국이 AI 개발에서 뒤처지지 않는 능력에 상당한 영향을 미칠 수 있다.

중국의 궁극적인 목표는 산업의 모든 측면에서 반도체 자립도를 달성하는 것이다. 이를 위해 중정부는 지난 2015년에 2025년까지 반도체 자립도를 70%로 달성하겠다는 목표를 세웠다. ITIF는 목표연도인 올해까지 중국정부가 반도체 자립도 30%에 도달할 것이며 이를 위해 추가로 1조 달러(약 1400조원)의 투자가 필요할 것으로 추산하고 있다. 또한 ITIF는 “중국은 적어도 2010년대 중반부터 반도체 산업 개발에 전념해 왔으며, 이는 트럼프와 바이든 행정부가 이 부문에 수출 통제를 부과하기 훨씬 이전부터였다. 따라서 미국의 수출 통제로 인해 중국이 토종 반도체 산업을 개발하기 위한 집중적으로 착수하게 된 것은 와전된 것이다”라고 주장한다.

중국의 대미 AI 칩 격차 최소화 전략은?

중국 칭화대와 연계된 AI칩 스타트업들. (자료=ITIF, 21024.8.26)

중국은 AI 칩 기술 격차를 메우기 위해 아래와 같은 여러 전략적 구상을 통해 적극적으로 노력하고 있다.

▲국가 주도적 노력=중국 정부는 최근 두 차례의 회의에서 논의된 것처럼 AI 개발을 의제의 최우선 순위에 두었다. 국유자산감독관리위원회(SASAC·国有资产监督管理委员会)는 중앙에서 관리하는 국유기업이 AI 개발을 전반적인 계획에 통합하도록 촉구하고 있다.

▲수직 도메인에 집중=중국 기업은 특정 사업 도메인을 위한 전문 AI 모델 개발에 집중하고 있으며, 이는 특정 분야에서 GPT-4.0과 같은 범용 모델을 잠재적으로 능가할 수 있다.

▲애플리케이션 강조=중국 AI 스타트업은 다양한 산업에 기술을 적용하고 다양한 애플리케이션을 상용화하는 데 더 집중하고 있으며, 개인화된 제품과 혁신을 만드는 데 있어 유연성을 보이고 있다.

▲중국내 칩 생산=화웨이와 SMIC는 국내에서 고급 AI 칩을 생산하려는 중국의 노력을 선도하고 있다. SMIC는 14nm 칩의 대량 생산을 시작했지만 여전히 글로벌 리더보다 1~2세대 뒤처져 있다.

▲정부 재정 지원=중국 정부는 더 넓은 혁신 기반을 조성하기 위한 차원에서 잠재력이 높은 기업들, 특히 간과될 수 있는 지역들을 육성하기 위한 재정 지원을 제공하고 있다.

▲산학협력=칭화대학교와 같은 명문 기관들은 특히 생성적 AI 분야에서 AI 혁신의 경계를 넓히는 차세대 AI 스타트업을 지원하고 있다.

▲분산형 접근 방식=중국의 지방 정부들은 AI 개발 전략을 특정 상황 맞춤형으로 조정함으로써 더 다양하고 적응 가능한 혁신 생태계를 촉진할 수 있도록 해 왔다.

이러한 노력에도 불구하고 중국은 컴퓨팅 파워, 클라우드 서버, AI 칩과 같은 핵심 분야에서 여전히 어려움에 직면해 있으며, 이 분야에서 미국과 상당한 격차가 남아 있다. 첨단 칩 제조 장비 및 설계 도구에 대한 미국의 수출 통제의 영향도 중국의 AI 칩 개발에 장애물이 되고 있다.

화웨이칩 vs 엔비디아 칩

조만간 나올 중국 화웨이의 어센드 910C 칩은 성능 면에서 엔비디아의 H100과 맞먹는다고 한다. 화웨이는 2025년 12월까지 140만 개의 910C 칩을 생산할 계획이다. (사진=화웨이 유튜브)

화웨이의 AI 칩은 현재 성능과 안정성 면에서 엔비디아보다 뒤처져 있지만 정확한 격차를 정량화하기는 어렵다. 화웨이는 어센드(Ascend) 시리즈 AI 칩 개발에 상당한 진전을 이루었지만 여전히 다음과 같은 여러 가지 과제에 직면해 있다.

▲성능=화웨이의 최신 어센드 910B 칩은 가공하지 않은 컴퓨팅 성능 면에서 엔비디아의 A100과 유사하다고 한다. 그러나 여러 업계 관계자는 화웨이의 칩이 가장 앞선 AI 작업 면에서 엔비디아보다 여전히 크게 뒤처져 있다고 밝혔다.

▲소프트웨어 생태계=2006년에 도입된 엔비디아의 쿠다(CUDA) 소프트웨어 플랫폼은 상당한 이점을 제공한다. 화웨이의 소프트웨어 생태계는 덜 성숙해 안정성 문제, 그리고 칩 간 연결 속도가 느려지는 문제가 있다.

▲제품 성숙도=화웨이의 신경망용 컴퓨팅 아키텍처(Compute Architecture for Neural Networks·Cann)은 지난 2018년에야 나왔지만 엔비디아의 생태계는 초기 GPU 시절부터 개발돼 왔다.

화웨이는 이러한 어려움에도 불구하고 진전을 이루고 있는 것으로 알려지고 있으며 기대 성능과 양산 시점은 다음과 같다.

▲성능=조만간 나올 어센드 910C 칩은 성능 면에서 엔비디아의 H100과 맞먹는다고 한다.

▲양산=화웨이는 2025년 12월까지 140만 개의 910C 칩을 생산할 계획이다.

이 회사는 강력한 고객 서비스를 활용해 고객과 긴밀히 협력하고 문제 해결을 위해 대응하고 있다.

AI 칩 환경이 빠르게 진화하고 있으며 특히 중국 정부의 지속적인 투자와 지원으로 화웨이와 엔비디아 간의 격차가 앞으로 좁아질 수 있다는 점에 유의하는 것이 중요하다.

시진핑, 중국 빅테크 AI 경쟁력 독려···칩 개발·구매 양면 전력투구

22일 중국 관영 차이나데일리 등 중국 매체에 따르면 미중 AI 패권 경쟁 가열 속에 알리바바가 공격적 AI투자 움직임의 선두에 섰다.

이는 시진핑 중국 국가주석이 지난 17일 중국 빅테크 수장들을 불러 모아 놓고 지원을 약속한 뒤 나왔다.

중국 최대 전자상거래 기업 알리바바는 지난 10년간 총투자액보다 많은 자금을 향후 3년간 AI 분야에 투입하기로 했다.

우융밍 알리바바 최고경영자(CEO)는 지난 20일 실적 발표 행사와 함께 늦은 시간에 가진 투자자 컨퍼런스콜에서 “향후 3년간 클라우드와 AI 인프라에 대한 투자가 지난 10년 동안 지출한 금액을 초과할 것으로 예상된다”고 말했다.

알리바바의 AI 투자는 지난해 상반기 기준 230억위안(약 4조5600억원)이었다. 보도에 따르면 알리바바 그룹 홀딩 유한회사는 AI 기술의 발전으로 산업이 근본적으로 변혁됨에 따라 향후 3년 동안 AI 및 클라우드 컴퓨팅 인프라, AI 기반 모델 및 네이티브 애플리케이션을 포함한 AI 투자를 확대하고 기존 사업을 AI로 혁신할 것이라고 밝혔다.

우는 대규모 언어 모델(LLM)인 큐원(Qwen·千问)2.5-맥스를 기반으로 한 심층 추론 모델을 곧 출시할 것이라고 말했다. 알리바바는 지난달 출시한 이 AI 모델이 중국 AI 스타트업 딥시크의 V3는 물론, 오픈AI의 GPT-4o, 메타의 라마 3.1을 모든 영역에서 능가한다고 주장했다.

텐센트 역시 올해 AI 투자를 대폭 확대할 것으로 예상된다. 텐센트는 거대 AI 모델의 폭발적 성장에 자극받아 전략 수정에 나선 것으로 알려졌다. 텐센트의 작년 상반기 AI 투자 규모는 알리바바와 같은 230억위안이었다.

사우스차이나모닝포스트는 23일(현지시각) 텐센트 홀딩스가 빠르게 발전하는 사업분야에서 경쟁력을 유지하기 위한 노력을 배가하면서 AI 제품 포트폴리오에 광범위한 변경을 가했다고 보도했다. 보도는 중국 디지털 미디어 더페이퍼를 인용, 이 소셜 미디어 및 비디오 게임 대기업이 최근 QQ 브라우저, 중국어 입력 키보드 도구 소구 핀인(Sogou Pinyin·搜狗拼音)및 학습 도우미 이마(Ima)를 포함한 여러 앱을 플랫폼앤콘텐츠그룹에서 클라우드 앤스마트 사업그룹(CSIG)으로 통합했다. 이는 이 회사의 테크놀로지 엔지니어링그룹이 AI 챗봇 위안바오(元宝) )를 CSIG로 이전한 데 따른 것이다.

파이낸셜 타임스는 지난달 21일 틱톡 모회사 바이트댄스가 AI칩에 올해에만 120억달러(약 원)를 투자할 계획이다. 연내 중국내에서 55억달러(약 7조 900억원)의 예산으로 AI칩을 사들이고, 또 해외에서 68억달러(약 9조 8000억원) 규모의 엔비디아칩을 구입해 AI 기본모델학습능력을 높일 계획이다. 이같은 AI칩 구매액은 지난해의 2배수준이다. 틱톡은 여러 나라에서 사용 규제 움직임 속에 이같은 AI투자로 돌파구를 찾아나서려는 것으로 해석된다.

작년 상반기 총 42억위안(약 8330억원)을 AI에 투입한 바이두의 리옌훙 CEO는 올해 AI 분야에서 투자효과가 나타날 것이라고 밝혔다. 바이두는 중국에서 비교적 초기에 AI 챗봇 어니(Ernie)를 출시했지만 비교적 낮은 평가를 받으며 리옌훙이 시진핑 좌담회에 초대받지 못하는 등 AI 분야에서 고전하는 분위기다. 하지만 올해 하반기에 어니 5.0을 출시하고 모든 사용자에게 어니봇을 무료로 제공하며 확산의 계기로 삼을 계획이다.

이재구 기자

jklee@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

‘링크의 시대’에서 ‘답변의 시대’로…구글 ‘서치 라이브’가 바꾸는 검색의 질서

서치 라이브는 검색 결과를 읽는 경험보다, 검색과 ‘대화하는’ 경험에 가깝다. 사용자는 구글 앱 안에서 음성으로 질문을 이어가고, 필요하면 카메라로 사물을 비추며 실시간 도움을 받을 수 있다. 이는 검색이 단발성 쿼리에서 벗어나 문맥을 유지하는 세션형 인터페이스로 이동하고 있음을 보여준다.

‘AI’를 향한 아마존의 거대한 ‘20년 승부수’

[AI요약] 20년전 생소한 개념의 클라우드 컴퓨팅 서비스인 AWS를 출시한 후, 해당 서비스를 인터넷 기반 도구에 의존하는 거의 모든 기업에게 필수불가결한...

[AI, 이제는 현장이다③] AI가 커질수록 공격도 빨라진다… 기업 보안이 다시 ‘기본기’로 돌아가야 하는 이유

AI를 말하면서 이제 보안을 따로 떼어놓기는 어렵다. AI가 기업 전반으로 퍼질수록 공격자도 같은 기술을 손에 넣고 있기 때문이다. 문제는 공격의 방향이 완전히 새로워졌다는 데 있지 않다. 오히려 익숙한 공격이 더 빨라지고, 더 값싸지고, 더 넓게 퍼질 수 있게 됐다는 점이 더 중요하다.

‘AI 에이전트 Vs. 일상생활’ 실리콘 밸리와 대중의 격차

빅테크들이 엄청난 자금을 투입하면서 미래 기술로 보고 있는 AI를 우리는 얼마나 활용하고 있을까. AI 에이전트가 차세대 기술의 핵심으로 강조되고 있는 가운데, 미국인의 65%는 업무에 AI를 전혀 사용하지 않는 것으로 나타났다. 혁신적인 기술은 막대한 가치를 창출하지만 그 가치의 대부분은 기술을 개발하고 도입하는 기업과 투자자에게 돌아간다는 지적이 나온다.