엔비디아, 최신 시각 AI 기술 혁신 선보여

NVIDIA researchers are presenting new vision-generating AI models and technologies this week at the Computer Vision and Pattern Recognition (CVPR) Conference in Seattle. This presentation covers a variety of fields, including custom image creation, 3D scene editing, visual language understanding, and autonomous vehicle recognition. “Artificial intelligence, especially generative AI, represents a significant technological advance,” said Jan Kautz, vice president of Learning and Cognition Research at NVIDIA. “At CVPR, NVIDIA Research is sharing how we are pushing the boundaries of what is possible, from powerful image generation models to self-driving software that could enable the next generation of self-driving cars.” In the field of visual language, NVIDIA collaborated with MIT to develop VILA, a new visual language model that achieves state-of-the-art performance in understanding images, video, and text. With enhanced reasoning capabilities, VILA can even understand internet memes by combining visual and verbal understanding. The breadth of NVIDIA's CVPR research demonstrates how generative AI can empower creators, accelerate automation in manufacturing and healthcare, and advance autonomy and robotics.

비디아 연구원들이 이번 주 시애틀에서 열리는 컴퓨터 비전 및 패턴 인식(CVPR) 컨퍼런스에서 새로운 시각 생성 AI 모델과 기술을 발표한다. 이번 발표는 맞춤형 이미지 생성, 3D 장면 편집, 시각 언어 이해, 자율 주행 차량 인식 등 다양한 분야를 아우른다. 엔비디아의 학습 및 인식 연구 부문 부사장인 얀 카우츠(Jan Kautz)는 “인공지능, 특히 생성 AI는 중요한 기술적 진보를 나타낸다”라며, “CVPR에서 NVIDIA Research는 강력한 이미지 생성 모델부터 다음 세대 자율 주행 자동차를 가능하게 할 수 있는 자율 주행 소프트웨어에 이르기까지 우리가 가능한 것의 경계를 어떻게 넓히고 있는지 공유하고 있다”라고 밝혔다. 시각 언어 분야에서는 엔비디아가 MIT와 협력하여 이미지, 비디오 및 텍스트를 이해하는 데 있어 최첨단 성능을 달성하는 새로운 시각 언어 모델 VILA를 개발했다. 향상된 추론 능력을 갖춘 VILA는 시각적 및 언어적 이해를 결합하여 인터넷 밈까지도 이해할 수 있다. 엔비디아의 CVPR 연구의 폭넓은 범위는 생성 AI가 창작자들을 어떻게 지원하고, 제조 및 의료 분야에서 자동화를 가속화하며, 자율성 및 로봇 공학을 발전시킬 수 있는지 잘 보여준다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“바보 시리 가고 제미나이 챗봇 온다”… 애플, WWDC 2026서 반격

애플이 오는 6월 8일 개최되는 연례 개발자 컨퍼런스(WWDC 2026)에서 생성형 인공지능(AI) 기술을 전면에 내세운 대대적인 소프트웨어 혁신을 예고했다.

라즈베리 파이, 또 가격 인상...3GB 신모델 12만 5,600원에 출시

라즈베리 파이가 AI발 메모리 대란으로 주요 제품 가격을 또 인상했다. Pi 5 16GB는 100달러 오르고, Pi 500+는 150달러, Pi 500은 50달러 인상됐다. 신규 3GB Pi 4 모델은 83.75달러에 출시. 1·2GB 저용량 모델과 구형 제품 가격은 유지된다.

머스크의 스페이스X, SEC에 비공개 상장 신청…6월 증시 데뷔 추진

일론 머스크의 스페이스X가 SEC에 비공개 IPO 서류를 제출했다. 기업가치 최대 2,625조원, 공모 규모 최대 112조원으로 역대 최대 상장 기록 경신이 예상된다. 6월 상장을 목표로 xAI·X를 포함한 복합 기업으로 증시 데뷔를 준비 중이다.

삼성, 멀미 완화 앱 '히어라피' 출시...이어폰으로 60초 들으면 2시간 효과

삼성이 이어폰으로 멀미를 완화하는 무료 앱 '히어라피'를 출시했다. 100Hz 저음 사인파를 60초간 들으면 최대 2시간 멀미 증상이 억제되며, 갤럭시 버즈4 프로 외 타사 이어폰에서도 사용 가능하다.