구글, 제미나이 1.5프로 발표...1시간 짜리 동영상도 요약해준다

Google announced the release of Gemini 1.5 Pro, the latest addition to its Gemini GenAI model family, designed to process a significantly larger amount of data compared to its predecessor. The new model can handle about 700,000 words or 30,000 lines of code, which is 35 times the capacity of Gemini 1.0 Pro. Beyond text, Gemini 1.5 Pro can also ingest up to 11 hours of audio or an hour of video in various languages. However, the version accessible to most developers and customers, currently in limited preview, can process only around 100,000 words at once. The large-data-input capability of Gemini 1.5 Pro is deemed "experimental" and is available only to developers in a private preview through Google's GenAI development tool, AI Studio. Google is continuing to optimize the model, already testing a version with a 10 million-token context window. Gemini 1.5 Pro promises to enable a range of tasks, such as analyzing entire code libraries, "reasoning across" lengthy documents, maintaining extended conversations with chatbots, and analyzing and comparing video content comprehensively.

구글이 '제미나이 1.5 프로' 모델을 발표했다. 이 모델은 대량의 데이터를 처리할 수 있는 능력이 특징으로, 약 700,000단어나 30,000줄의 코드를 처리할 수 있으며, 이는 제미나이 1.0 프로가 처리할 수 있는 양의 35배에 해당한다. 또한, 텍스트뿐만 아니라 최대 11시간의 오디오나 1시간 분량의 비디오도 다양한 언어로 처리할 수 있다. 하지만 대부분의 개발자와 고객이 접근할 수 있는 제미나이 1.5 프로 버전은 한 번에 약 100,000단어만 처리할 수 있으며, 사설 프리뷰를 통해 승인된 개발자만이 AI Studio라는 구글의 GenAI 개발 도구를 통해 이를 시험해볼 수 있다. 구글은 제미나이 1.5 프로의 성능을 개선하기 위해 모델 최적화 작업을 계속하고 있으며, 이미 10백만 토큰 컨텍스트 윈도우를 가진 버전을 테스트 중이다. 이 모델은 전체 코드 라이브러리를 분석하거나 긴 문서를 추론하고, 챗봇과 긴 대화를 유지하며, 비디오 콘텐츠를 분석하고 비교하는 등 다양한 작업을 수행할 수 있다.

Google's new Gemini model can analyze an hour-long video -- but few people can use it | TechCrunch

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

유튜브, 일시 정지 화면 광고 도입…스마트 TV부터 시작

YouTube is introducing pause screen ads, which will show ads even when viewers pause video playback. This will start with smart TVs. Google recently revealed the success of its pilot program for paused screen ads during the Alphabet earnings call. The program was run on connected TVs and showed positive results.

테더, 1분기 사상 최대 이익 기록... 스테이블코인 업계 지배력 강화

Tether (TETHER.USDT) posted its largest-ever first-quarter profit, further cementing its dominance of the stablecoin industry.

"스포티파이보다 라디오를 선택하는 이유"

The author prefers listening to radio over Spotify's algorithm-based music recommendations, as the latter tends to create a "rabbit hole" effect by repeatedly suggesting similar music based on recent listening history.

니오, 테슬라 대항마 되나... 4월 전기차 판매량 2배 이상 증가, 연간 성장률 134.6%

Shares of Chinese electric car maker Nio jumped more than 20% in April as its electric car sales more than doubled. Hong Kong-listed Nio shares jumped as much as 23% to HK$44.20, the highest in more than six weeks.