카카오, 대화·추론 동시 처리 AI '카나나 4b' 선보인다

카카오가 일반적인 대화와 복잡한 논리 추론을 하나의 시스템으로 처리하는 인공지능 모델을 새롭게 내놨다.

국내 빅테크 기업들이 자체 AI 개발 경쟁에 나서는 가운데, 한국어 특화 성능을 앞세운 전략으로 차별화를 시도한다는 분석이다.

5일 업계에 따르면 카카오가 공개한 '카나나 4b(Kanana-v-4b-hybrid)'는 기존 멀티모달 AI와 달리 사용 목적에 따라 작동 방식을 자동으로 전환하는 구조를 갖췄다. 간단한 질문에는 빠른 응답을, 수학 문제나 복잡한 분석이 필요한 경우에는 단계별 추론 과정을 거쳐 답변을 생성한다.

이 모델은 지난해 7월 공개된 '카나나 1.5-v-3b'의 후속 버전이다. 가장 큰 특징은 AI가 스스로 계산 결과를 재검토하는 '자기 점검' 기능을 탑재했다는 점이다. 카카오 측은 이를 통해 AI의 고질적 문제인 '환각 현상'(사실이 아닌 정보 생성)을 상당 부분 줄였다고 설명했다.

모델 학습에는 4단계 프로세스가 적용됐다. 기초 데이터 학습 이후 긴 문장으로 사고 과정을 표현하는 훈련을 거쳤고, 이어서 오프라인과 온라인 강화학습으로 성능을 끌어올렸다. 카카오는 이 과정에서 한국어 데이터를 집중 활용했다고 밝혔다.

실제로 한국어 처리 능력이 이 모델의 핵심 경쟁력으로 꼽힌다. 글로벌 AI 모델들은 한국어 질문을 받으면 일단 영어로 번역해 처리한 뒤 다시 한국어로 변환하는 과정을 거친다. 이 과정에서 문맥이나 미묘한 뉘앙스가 손실되는 경우가 많다. 반면 카나나는 한국어로 직접 사고하도록 설계돼 이런 문제를 피할 수 있다는 게 카카오 측 주장이다.

성능 검증 결과도 공개됐다. 국내 교육과정을 반영한 AI 평가 벤치마크 'KoNET'에서 92.8점을 기록했다. 수능 사회탐구와 수학 영역 문제에서도 한국어로 제시된 복잡한 조건들을 정확히 파악해 높은 정답률을 보였다고 한다.

글로벌 모델과의 비교에서도 선전했다. 유사 규모의 큐엔(Qwen3-VL-4B), 인턴VL(InternVL3.5-4B), GPT-5-nano 등과 비교 테스트를 진행한 결과, 과학·공학 문제 해결과 문서 이해 영역에서 경쟁력 있는 수치를 나타냈다. 특히 수학이나 과학처럼 논리적 추론이 중요한 분야에서는 일부 글로벌 모델을 앞선 것으로 나타났다.

카카오는 향후 이 기술을 더욱 발전시켜 사용자가 모드를 직접 선택하지 않아도 AI가 알아서 질문의 난이도를 판단해 적절한 방식으로 답변하는 시스템을 구축할 계획이다. 한 대화창에서 가벼운 잡담과 전문적인 분석을 모두 자연스럽게 처리하면서도 컴퓨팅 자원을 효율적으로 사용하겠다는 구상이다.

김병학 카카오 카나나 성과리더는 "한국어 사용 환경에 최적화된 AI를 개발해 글로벌 시장에서도 충분히 경쟁할 수 있다는 점을 보여주고 싶었다"며 "앞으로도 국내 AI 기술 발전에 기여할 수 있도록 연구를 지속하겠다"고 밝혔다.

한편 카카오는 최근 수개월간 여러 AI 모델을 연이어 공개하며 기술력 과시에 나섰다. 지난달에는 음성·이미지·텍스트를 동시에 처리하는 '카나나o(Kanana-o)'와 임베딩 특화 모델 '카나나 임베딩(Kanana-v-embedding)'을 선보였으며, 에이전트 AI에 최적화된 '카나나 2(Kanana-2)' 모델도 오픈소스로 공개한 바 있다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

채용 공고부터 추천까지 한 번에…AI로 묶은 ‘통합 채용 허브’ 등장

잡코리아가 AI 기반 통합 채용 솔루션 ‘하이어링 센터’를 공개했다. 채용 공고 등록부터 지원자 관리, 커뮤니케이션, 운영 관리까지 전 과정을 하나의 환경에서 처리할 수 있도록 설계된 것이 핵심이다.

정답 아닌 과정 본다…AI 활용 역량, 다면 분석으로 판별

‘AI 역량평가’는 응시자가 AI를 활용해 결과를 도출하는 과정 자체를 분석한다. 프롬프트를 설계하고, AI의 응답을 검증한 뒤 이를 보완해 최종 성과로 연결하는 일련의 단계가 평가 대상이다. 단순 정답 여부가 아니라 활용 과정의 완성도를 데이터 기반으로 측정한다는 점에서 기존 평가와 차별화된다.

마이크로소프트, AI 한 명 시대 접고 ‘집단 검토’로 간다… 코파일럿 리서처에 GPT·클로드 동시 투입

마이크로소프트가 자사 업무용 AI 서비스인 마이크로소프트 365 코파일럿의 심화 조사 도구 ‘리서처’에 복수의 대형언어모델(LLM)을 함께 활용하는 구조를 도입했다.

QAI-LG전자 등 4사 맞손… ‘양자·AI 결합 데이터센터’ 시장 선점 나선다

AI 연산 폭증 속 전력·효율 한계 대응… 차세대 인프라 협력 본격화 하이브리드 퀀텀 엣지 데이터센터 공동 구축… 역할 분담 기반...