중국 알리바바, 개발자 위한 대규모 언어모델 기반 프로그래밍 지원 시스템 선보여

대규모 파라미터로 GPT-5.2, Claude Opus 4.5, Gemini 3 Pro와 경쟁
적응형 도구 활용과 테스트 단계 확장 기술로 차별화… '오픈소스 전략'으로 허깅페이스 7억 다운로드 돌파
Alibaba Logo

중국 전자상거래 기업 알리바바가 4일 개발자들의 소프트웨어 제작 과정을 돕는 인공지능 시스템 '큐웬3-코더'를 발표했다. 이번에 공개된 시스템은 프로그램 작성부터 오류 수정, 복잡한 개발 흐름 조율까지 개발 전 과정에서 자율적으로 작동하도록 설계됐다는 것이 회사 측 설명이다.

이번 모델은 전문가 혼합 방식으로 알려진 MoE 구조를 채택했으며, 4천8백억 개 규모의 변수 중 실제 연산 시에는 3백50억 개만 동작시키는 방식으로 처리 속도와 자원 효율을 동시에 확보했다. 회사 측은 자율 작동 프로그래밍, 웹 브라우저 제어, 외부 도구 연결 등 다양한 평가 지표에서 현존 최고 수준 시스템들에 필적하는 결과를 얻었다고 밝혔다.

'Qwen3-Max-Thinking' 총 19개 주요 벤치마크 평가에서 Anthropic의 Claude Opus 4.5, 구글의 Gemini 3 Pro, 오픈AI의 GPT-5.2-Thinking-xhigh 등 최신 모델들과 경쟁력 있는 성능을 보였다. GPQA Diamond 평가에서 92.8점으로 박사급 과학 문제 해결 역량을, IMO-AnswerBench에서는 91.5점으로 고교 수준 수학 문제 처리 능력을 입증했다.

2023년부터 쌓아온 기술력

Qwen AI Model
알리바바의 Qwen 모델은 2023년 4월 Tongyi Qianwen 베타판 출시 이후 꾸준히 발전해왔다. 중국어 '千问(천 개의 질문)'에서 이름을 따온 이 시리즈는 알리바바 클라우드 산하 연구소 通义(Tongyi)가 개발하고 있다.

알리바바는 이와 별도로 개발자가 일상 언어로 프로그래밍 업무를 인공지능에게 맡길 수 있는 명령어 기반 인터페이스 '큐웬 코드'도 함께 배포했다. 해당 도구는 특화된 지시문과 대화 방식으로 구성돼 있어 큐웬3-코더의 자율 프로그래밍 능력을 최대한 끌어낼 수 있으며, 앤스로픽사의 클로드 코드 환경과도 연동 가능해 기존 개발 환경에서 바로 활용할 수 있다.

큐웬3-코더는 대량의 프로그램 코드와 일반 문서 데이터를 학습했으며, 기본 설정에서 25만6천 개 토큰 분량의 문맥을 인식하고 최대 1백만 개까지 처리 범위를 늘릴 수 있어 대형 프로젝트의 전체 코드를 한 번에 다룰 수 있다. 회사 측은 학습 단계에서 데이터량과 문맥 길이, 인공 생성 데이터 규모를 대폭 늘렸을 뿐 아니라 에이전트 강화학습이라는 새로운 훈련 기법을 적용해 모델이 외부 도구를 여러 단계에 걸쳐 활용하며 실무 수준의 난제를 해결할 수 있게 됐다고 설명했다.

그 결과 큐웬3-코더는 실제 소프트웨어 엔지니어링 문제 해결 능력을 측정하는 'SWE-벤치 베리파이드' 평가에서 테스트 단계 연산 확장 없이도 공개 모델 가운데 최상위 점수를 기록했다고 회사는 강조했다.

현재 큐웬3-코더-480B-A35B-인스트럭트 버전은 허깅페이스와 깃허브 저장소를 통해 내려받을 수 있다. 개발자들은 큐웬 챗 서비스나 알리바바의 생성형 인공지능 플랫폼 모델 스튜디오에서 제공하는 API를 통해 합리적인 비용으로 이 시스템을 이용할 수 있다.

김한수 기자

hanskim@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

"문서 지옥이 싫었다"…비전공 공무원 혼자서 쓴 공직사회 AI 혁신

광진구청 류승인 주무관이 개발한 HWP 파서 'kordoc'과 법령 검색 MCP 서버 'korean-law-mcp'가 공직사회 AI 혁신 사례로 화제다. 비전공자 공무원의 바텀업 혁신, 두 도구 모두 오픈소스 무료 공개.

채용 공고부터 추천까지 한 번에…AI로 묶은 ‘통합 채용 허브’ 등장

잡코리아가 AI 기반 통합 채용 솔루션 ‘하이어링 센터’를 공개했다. 채용 공고 등록부터 지원자 관리, 커뮤니케이션, 운영 관리까지 전 과정을 하나의 환경에서 처리할 수 있도록 설계된 것이 핵심이다.

‘링크의 시대’에서 ‘답변의 시대’로…구글 ‘서치 라이브’가 바꾸는 검색의 질서

서치 라이브는 검색 결과를 읽는 경험보다, 검색과 ‘대화하는’ 경험에 가깝다. 사용자는 구글 앱 안에서 음성으로 질문을 이어가고, 필요하면 카메라로 사물을 비추며 실시간 도움을 받을 수 있다. 이는 검색이 단발성 쿼리에서 벗어나 문맥을 유지하는 세션형 인터페이스로 이동하고 있음을 보여준다.

‘AI’를 향한 아마존의 거대한 ‘20년 승부수’

[AI요약] 20년전 생소한 개념의 클라우드 컴퓨팅 서비스인 AWS를 출시한 후, 해당 서비스를 인터넷 기반 도구에 의존하는 거의 모든 기업에게 필수불가결한...