구글, 제미나이 1.5프로 발표...1시간 짜리 동영상도 요약해준다

Google announced the release of Gemini 1.5 Pro, the latest addition to its Gemini GenAI model family, designed to process a significantly larger amount of data compared to its predecessor. The new model can handle about 700,000 words or 30,000 lines of code, which is 35 times the capacity of Gemini 1.0 Pro. Beyond text, Gemini 1.5 Pro can also ingest up to 11 hours of audio or an hour of video in various languages. However, the version accessible to most developers and customers, currently in limited preview, can process only around 100,000 words at once. The large-data-input capability of Gemini 1.5 Pro is deemed "experimental" and is available only to developers in a private preview through Google's GenAI development tool, AI Studio. Google is continuing to optimize the model, already testing a version with a 10 million-token context window. Gemini 1.5 Pro promises to enable a range of tasks, such as analyzing entire code libraries, "reasoning across" lengthy documents, maintaining extended conversations with chatbots, and analyzing and comparing video content comprehensively.

구글이 '제미나이 1.5 프로' 모델을 발표했다. 이 모델은 대량의 데이터를 처리할 수 있는 능력이 특징으로, 약 700,000단어나 30,000줄의 코드를 처리할 수 있으며, 이는 제미나이 1.0 프로가 처리할 수 있는 양의 35배에 해당한다. 또한, 텍스트뿐만 아니라 최대 11시간의 오디오나 1시간 분량의 비디오도 다양한 언어로 처리할 수 있다. 하지만 대부분의 개발자와 고객이 접근할 수 있는 제미나이 1.5 프로 버전은 한 번에 약 100,000단어만 처리할 수 있으며, 사설 프리뷰를 통해 승인된 개발자만이 AI Studio라는 구글의 GenAI 개발 도구를 통해 이를 시험해볼 수 있다. 구글은 제미나이 1.5 프로의 성능을 개선하기 위해 모델 최적화 작업을 계속하고 있으며, 이미 10백만 토큰 컨텍스트 윈도우를 가진 버전을 테스트 중이다. 이 모델은 전체 코드 라이브러리를 분석하거나 긴 문서를 추론하고, 챗봇과 긴 대화를 유지하며, 비디오 콘텐츠를 분석하고 비교하는 등 다양한 작업을 수행할 수 있다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

유튜브, ‘코첼라 2026’ 전 세계 무료 생중계

세계 최대 음악 축제인 ‘코첼라 밸리 뮤직 앤드 아츠 페스티벌(이하 코첼라)’을 안방에서 고화질로 즐길 수 있게 됐다.

머스크의 스페이스X, IPO 추진…xAI 합병·나스닥 편입 가능성까지

스페이스X가 SEC에 IPO 비공개 서류를 제출했다. 목표 조달액 750억 달러로 역대 최대 규모다. xAI 합병 리스크와 나스닥 100 자동 편입 가능성도 주목된다.

오픈AI, 애플 카플레이용 ‘AI 음성 비서’ 전격 출시

운전 중 스마트폰을 만지지 않고도 생성형 AI와 자유롭게 대화할 수 있는 시대가 열렸다. 1일(현지시간) 오픈AI는 애플의 차량용 인포테인먼트 시스템인 '카플레이(CarPlay)'에 챗GPT 음성 모드를 공식 지원한다고 밝혔다.

클라우드플레어, 워드프레스 대안 CMS '엠대시' 공개

클라우드플레어가 AI로 두 달 만에 개발한 오픈소스 CMS '엠대시'를 공개했다. 워드프레스 플러그인 보안 문제를 격리 샌드박스로 해결하고 AI 에이전트 관리 기능을 기본 탑재했다.