엔비디아, 최신 시각 AI 기술 혁신 선보여

NVIDIA researchers are presenting new vision-generating AI models and technologies this week at the Computer Vision and Pattern Recognition (CVPR) Conference in Seattle. This presentation covers a variety of fields, including custom image creation, 3D scene editing, visual language understanding, and autonomous vehicle recognition. “Artificial intelligence, especially generative AI, represents a significant technological advance,” said Jan Kautz, vice president of Learning and Cognition Research at NVIDIA. “At CVPR, NVIDIA Research is sharing how we are pushing the boundaries of what is possible, from powerful image generation models to self-driving software that could enable the next generation of self-driving cars.” In the field of visual language, NVIDIA collaborated with MIT to develop VILA, a new visual language model that achieves state-of-the-art performance in understanding images, video, and text. With enhanced reasoning capabilities, VILA can even understand internet memes by combining visual and verbal understanding. The breadth of NVIDIA's CVPR research demonstrates how generative AI can empower creators, accelerate automation in manufacturing and healthcare, and advance autonomy and robotics.

비디아 연구원들이 이번 주 시애틀에서 열리는 컴퓨터 비전 및 패턴 인식(CVPR) 컨퍼런스에서 새로운 시각 생성 AI 모델과 기술을 발표한다. 이번 발표는 맞춤형 이미지 생성, 3D 장면 편집, 시각 언어 이해, 자율 주행 차량 인식 등 다양한 분야를 아우른다. 엔비디아의 학습 및 인식 연구 부문 부사장인 얀 카우츠(Jan Kautz)는 “인공지능, 특히 생성 AI는 중요한 기술적 진보를 나타낸다”라며, “CVPR에서 NVIDIA Research는 강력한 이미지 생성 모델부터 다음 세대 자율 주행 자동차를 가능하게 할 수 있는 자율 주행 소프트웨어에 이르기까지 우리가 가능한 것의 경계를 어떻게 넓히고 있는지 공유하고 있다”라고 밝혔다. 시각 언어 분야에서는 엔비디아가 MIT와 협력하여 이미지, 비디오 및 텍스트를 이해하는 데 있어 최첨단 성능을 달성하는 새로운 시각 언어 모델 VILA를 개발했다. 향상된 추론 능력을 갖춘 VILA는 시각적 및 언어적 이해를 결합하여 인터넷 밈까지도 이해할 수 있다. 엔비디아의 CVPR 연구의 폭넓은 범위는 생성 AI가 창작자들을 어떻게 지원하고, 제조 및 의료 분야에서 자동화를 가속화하며, 자율성 및 로봇 공학을 발전시킬 수 있는지 잘 보여준다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

럭셔리 SUV라더니 안전벨트가 툭? 루시드, 신차 ‘그래비티’ 전량 리콜

미국 신생 전기차 제조사 루시드 모터스(Lucid Motors)가 야심 차게 내놓은 대형 SUV ‘그래비티(Gravity)’가 안전벨트 결함으로 체면을 구겼다.

애플, iOS 18에 이례적 보안 패치…다크소드 해킹 툴 방어 나섰다

애플이 아이폰 해킹 툴킷 '다크소드' 대응을 위해 iOS 18 전용 보안 패치를 이례적으로 배포한다. 감염된 웹사이트 방문만으로 해킹되는 원클릭 공격으로, 깃허브 유출 후 위협이 급확산됐다. iOS 18 사용자의 약 25%가 보호 대상이다.

“인류 최대의 상장”… 스페이스X, 100조 원 규모 IPO 비공개 신청

일론 머스크가 이끄는 우주 항공 기업 스페이스X가 마침내 증권 시장 상장을 위한 첫발을 뗐다. 1일(현지시간) 블룸버그 통신 등 외신에 따르면 스페이스X는 최근 미국 증권거래위원회(SEC)에 기업공개(IPO)를 위한 등록 서류 초안을 비공개로 제출했다.

“4천만 원대 전기 스포티지 떴다”… 기아 EV3, 뉴욕 오토쇼서 美 시장 전격 데뷔

기아가 뉴욕 국제 오토쇼에서 소형 전기 SUV인 ‘2027년형 EV3’를 공개하며 북미 시장 공략을 가시화했다. 해외 시장 출시 이후 현지 소비자들의 기대를 모았던 EV3는 올해 말 미국 시장에 공식 상륙할 예정이다.