서울대 공대 전병곤 교수팀, AI 학습 및 추론 수행 시 기존 대비 22배 빠른 님블 시스템 개발

 

서울대학교 컴퓨터공학부 전병곤 교수 연구팀이 그래픽 처리 장치(GPU)를 활용해 인공지능 학습과 추론 수행 시 기존 시스템 대비 최대 22배 빠른 님블(Nimble) 시스템을 개발했다고 30일 밝혔다.

이 시스템을 통해 응용 서비스에서 인공지능 모델을 곧바로 고속 수행하는 것이 가능해져 다양한 분야에서 인공지능 모델의 효율적 사용이 가능할 것으로 기대된다. 현재 수많은 기업과 연구소가 인공지능 계산의 편의성을 위해 파이토치(PyTorch), 텐서플로우(TensorFlow) 등의 인공지능 시스템을 사용하고 있다. 이러한 시스템들은 인공지능 학습과 추론 수행 속도 향상을 위해 GPU를 이용한다. GPU에 연산 수행을 요청하기 전에는 이를 위한 준비를 하는 스케줄링(scheduling) 과정을 매번 진행한다.

전병곤 교수 연구팀은 현 인공지능 시스템들이 스케줄링 과정의 오버헤드로 인해 GPU를 효율적으로 활용하지 못하고 또한 GPU에서 병렬로 수행할 수 있는 연산들을 병렬로 수행하지 못한다는 것을 밝혀냈다. 연구팀은 이러한 문제를 해결하기 위해 사전에 스케줄링 과정을 한 번만 하고 여러 개의 GPU 스트림을 사용해 다수의 GPU 연산을 동시에 수행하는 인공지능 시스템 님블을 개발하였다. 님블은 파이토치 대비 인공지능 추론을 22.3배, 학습을 3.6배 빠르게 수행하며 인공지능 추론 특화 시스템인 엔비디아(NVIDIA)의 텐서RT(TensorRT)보다 2.8배 빠르게 인공지능 추론을 수행한다. 또한 님블은 개발 시 사용자 편의성을 고려해 설계되었다. 코드를 몇 줄만 수정하면 기존에 사용하던 파이토치 모델을 님블을 이용해 수행할 수 있다.

이번 연구 결과는 12월 온라인 개최 예정인 인공지능 분야 세계 최고 학회 뉴립스(Neural Information Processing Systems·신경정보처리시스템학회)의 스포트라이트(spotlight) 세션에서 발표될 예정이다. 이 스포트라이트 세션은 올해 뉴립스에 제출된 9467편의 논문 중 약 상위 4%의 논문에만(구두 세션: 105편, 스포트라이트 세션: 280편) 주어지는 발표 기회이다.

전병곤 교수는 이번 개발에 대해 “세계를 선도할 인공지능 플랫폼 기술을 발표하게 되어 기쁘다. 앞으로 활발히 인공지능 플랫폼 기술을 연구하고 사업화하는 데 주력하겠다”고 소감을 말했다.

윤소영 기자

ericahue@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

당근마켓 ‘불법거래 STOP’, 중고거래 가이드라인 2.0 발표

당근마켓이 그간 지속적으로 문제가 제기된 불법 거래를 근절하고 중고거래 이용자 보호와 안전을 강화하는 새로운 운영 정책(가이드 라인)을 발표했다. 17일 당근마켓에...

토스, 37개 포지션 100여명 ‘기술인력 대거 채용’

오는 10월 토스뱅크 출범을 앞두고 있는 모바일 금융 서비스 토스가 17일 사업 확장에 따른 대규모 인력 채용을 밝혔다. 채용 대상은...

LG전자 창원 사업장, 지능형 자율공장 체제로 전환

LG전자가 글로벌 생활가전 사업의 핵심 생산기지인 창원사업장을 지능형 자율공장 체제로 본격 전환한다. LG전자는 경남 창원시에 있는 LG스마트파크(경상남도 창원시 성산구 성산패총로...

네이버클라우드 "연매출의 80% 투자, 아태지역 톱3 목표"

네이버클라우드가 일본을 포함한 아시아태평양 클라우드 시장에서 아마존웹서비스(AWS), 마이크로소프트에 이어 톱3 업체로 발돋움하겠다는 목표를 내걸었다. 이를 위해 2023년까지 연 매출 80%를...