엔비디아, 최신 시각 AI 기술 혁신 선보여

NVIDIA researchers are presenting new vision-generating AI models and technologies this week at the Computer Vision and Pattern Recognition (CVPR) Conference in Seattle. This presentation covers a variety of fields, including custom image creation, 3D scene editing, visual language understanding, and autonomous vehicle recognition. “Artificial intelligence, especially generative AI, represents a significant technological advance,” said Jan Kautz, vice president of Learning and Cognition Research at NVIDIA. “At CVPR, NVIDIA Research is sharing how we are pushing the boundaries of what is possible, from powerful image generation models to self-driving software that could enable the next generation of self-driving cars.” In the field of visual language, NVIDIA collaborated with MIT to develop VILA, a new visual language model that achieves state-of-the-art performance in understanding images, video, and text. With enhanced reasoning capabilities, VILA can even understand internet memes by combining visual and verbal understanding. The breadth of NVIDIA's CVPR research demonstrates how generative AI can empower creators, accelerate automation in manufacturing and healthcare, and advance autonomy and robotics.

비디아 연구원들이 이번 주 시애틀에서 열리는 컴퓨터 비전 및 패턴 인식(CVPR) 컨퍼런스에서 새로운 시각 생성 AI 모델과 기술을 발표한다. 이번 발표는 맞춤형 이미지 생성, 3D 장면 편집, 시각 언어 이해, 자율 주행 차량 인식 등 다양한 분야를 아우른다. 엔비디아의 학습 및 인식 연구 부문 부사장인 얀 카우츠(Jan Kautz)는 “인공지능, 특히 생성 AI는 중요한 기술적 진보를 나타낸다”라며, “CVPR에서 NVIDIA Research는 강력한 이미지 생성 모델부터 다음 세대 자율 주행 자동차를 가능하게 할 수 있는 자율 주행 소프트웨어에 이르기까지 우리가 가능한 것의 경계를 어떻게 넓히고 있는지 공유하고 있다”라고 밝혔다. 시각 언어 분야에서는 엔비디아가 MIT와 협력하여 이미지, 비디오 및 텍스트를 이해하는 데 있어 최첨단 성능을 달성하는 새로운 시각 언어 모델 VILA를 개발했다. 향상된 추론 능력을 갖춘 VILA는 시각적 및 언어적 이해를 결합하여 인터넷 밈까지도 이해할 수 있다. 엔비디아의 CVPR 연구의 폭넓은 범위는 생성 AI가 창작자들을 어떻게 지원하고, 제조 및 의료 분야에서 자동화를 가속화하며, 자율성 및 로봇 공학을 발전시킬 수 있는지 잘 보여준다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

메타, 직원 8,000명 해고…역대 최고 실적에도 AI 투자 위해 감원

메타가 5월 20일부터 전 직원의 10%인 8,000명을 감원한다. 역대 최고 분기 실적에도 AI 인프라 투자를 위한 결정으로, 직원 사기 급락과 내부 반발이 이어지고 있다.

탠스택 오픈소스 공급망 공격, 오픈AI까지 피해..."사용자 데이터는 안전"

오픈소스 라이브러리 탠스택을 겨냥한 공급망 공격으로 오픈AI 직원 기기 2대가 침해됐다. 사용자 데이터와 핵심 시스템은 안전하나 일부 소스코드가 탈취됐으며, 맥OS 앱 업데이트가 필요하다.

포드, 에너지 저장 사업 진출 선언...AI 데이터센터 특수 전환 기대감

포드가 에너지 저장 사업 진출을 선언한 후 이틀간 주가 21% 급등. 약 2조 8,960억원(20억 달러)을 투자해 켄터키 공장을 전환하고, 2027년 납품을 목표로 한다. 모건스탠리는 사업가치 약 100억 달러를 전망했다.

인텔, 애플 칩 시험 생산 착수…2027년 양산 목표

인텔이 애플 칩 위탁 생산 테스트를 시작했다. 밍치 궈 분석가에 따르면 2027년 양산을 목표로 18A-P 공정을 활용하며, 물량의 80%는 아이폰용이다. TSMC는 여전히 90% 이상 공급을 담당한다.