중국 전자상거래 기업 알리바바가 4일 개발자들의 소프트웨어 제작 과정을 돕는 인공지능 시스템 '큐웬3-코더'를 발표했다. 이번에 공개된 시스템은 프로그램 작성부터 오류 수정, 복잡한 개발 흐름 조율까지 개발 전 과정에서 자율적으로 작동하도록 설계됐다는 것이 회사 측 설명이다.
이번 모델은 전문가 혼합 방식으로 알려진 MoE 구조를 채택했으며, 4천8백억 개 규모의 변수 중 실제 연산 시에는 3백50억 개만 동작시키는 방식으로 처리 속도와 자원 효율을 동시에 확보했다. 회사 측은 자율 작동 프로그래밍, 웹 브라우저 제어, 외부 도구 연결 등 다양한 평가 지표에서 현존 최고 수준 시스템들에 필적하는 결과를 얻었다고 밝혔다.

2023년부터 쌓아온 기술력
알리바바는 이와 별도로 개발자가 일상 언어로 프로그래밍 업무를 인공지능에게 맡길 수 있는 명령어 기반 인터페이스 '큐웬 코드'도 함께 배포했다. 해당 도구는 특화된 지시문과 대화 방식으로 구성돼 있어 큐웬3-코더의 자율 프로그래밍 능력을 최대한 끌어낼 수 있으며, 앤스로픽사의 클로드 코드 환경과도 연동 가능해 기존 개발 환경에서 바로 활용할 수 있다.
큐웬3-코더는 대량의 프로그램 코드와 일반 문서 데이터를 학습했으며, 기본 설정에서 25만6천 개 토큰 분량의 문맥을 인식하고 최대 1백만 개까지 처리 범위를 늘릴 수 있어 대형 프로젝트의 전체 코드를 한 번에 다룰 수 있다. 회사 측은 학습 단계에서 데이터량과 문맥 길이, 인공 생성 데이터 규모를 대폭 늘렸을 뿐 아니라 에이전트 강화학습이라는 새로운 훈련 기법을 적용해 모델이 외부 도구를 여러 단계에 걸쳐 활용하며 실무 수준의 난제를 해결할 수 있게 됐다고 설명했다.
그 결과 큐웬3-코더는 실제 소프트웨어 엔지니어링 문제 해결 능력을 측정하는 'SWE-벤치 베리파이드' 평가에서 테스트 단계 연산 확장 없이도 공개 모델 가운데 최상위 점수를 기록했다고 회사는 강조했다.
현재 큐웬3-코더-480B-A35B-인스트럭트 버전은 허깅페이스와 깃허브 저장소를 통해 내려받을 수 있다. 개발자들은 큐웬 챗 서비스나 알리바바의 생성형 인공지능 플랫폼 모델 스튜디오에서 제공하는 API를 통해 합리적인 비용으로 이 시스템을 이용할 수 있다.