서울대 공대 전병곤 교수팀, AI 학습 및 추론 수행 시 기존 대비 22배 빠른 님블 시스템 개발

 

서울대학교 컴퓨터공학부 전병곤 교수 연구팀이 그래픽 처리 장치(GPU)를 활용해 인공지능 학습과 추론 수행 시 기존 시스템 대비 최대 22배 빠른 님블(Nimble) 시스템을 개발했다고 30일 밝혔다.

이 시스템을 통해 응용 서비스에서 인공지능 모델을 곧바로 고속 수행하는 것이 가능해져 다양한 분야에서 인공지능 모델의 효율적 사용이 가능할 것으로 기대된다. 현재 수많은 기업과 연구소가 인공지능 계산의 편의성을 위해 파이토치(PyTorch), 텐서플로우(TensorFlow) 등의 인공지능 시스템을 사용하고 있다. 이러한 시스템들은 인공지능 학습과 추론 수행 속도 향상을 위해 GPU를 이용한다. GPU에 연산 수행을 요청하기 전에는 이를 위한 준비를 하는 스케줄링(scheduling) 과정을 매번 진행한다.

전병곤 교수 연구팀은 현 인공지능 시스템들이 스케줄링 과정의 오버헤드로 인해 GPU를 효율적으로 활용하지 못하고 또한 GPU에서 병렬로 수행할 수 있는 연산들을 병렬로 수행하지 못한다는 것을 밝혀냈다. 연구팀은 이러한 문제를 해결하기 위해 사전에 스케줄링 과정을 한 번만 하고 여러 개의 GPU 스트림을 사용해 다수의 GPU 연산을 동시에 수행하는 인공지능 시스템 님블을 개발하였다. 님블은 파이토치 대비 인공지능 추론을 22.3배, 학습을 3.6배 빠르게 수행하며 인공지능 추론 특화 시스템인 엔비디아(NVIDIA)의 텐서RT(TensorRT)보다 2.8배 빠르게 인공지능 추론을 수행한다. 또한 님블은 개발 시 사용자 편의성을 고려해 설계되었다. 코드를 몇 줄만 수정하면 기존에 사용하던 파이토치 모델을 님블을 이용해 수행할 수 있다.

이번 연구 결과는 12월 온라인 개최 예정인 인공지능 분야 세계 최고 학회 뉴립스(Neural Information Processing Systems·신경정보처리시스템학회)의 스포트라이트(spotlight) 세션에서 발표될 예정이다. 이 스포트라이트 세션은 올해 뉴립스에 제출된 9467편의 논문 중 약 상위 4%의 논문에만(구두 세션: 105편, 스포트라이트 세션: 280편) 주어지는 발표 기회이다.

전병곤 교수는 이번 개발에 대해 “세계를 선도할 인공지능 플랫폼 기술을 발표하게 되어 기쁘다. 앞으로 활발히 인공지능 플랫폼 기술을 연구하고 사업화하는 데 주력하겠다”고 소감을 말했다.

윤소영 기자

ericahue@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

미사일보다 먼저 멈추는 건 서버다…이란 전쟁, 중동 빅테크의 돈줄을 겨누다

중동은 한동안 빅테크의 차세대 성장지로 불렸다. 값싼 전력, 막대한 국부펀드 자금, 공격적인 국가 주도 투자, AI 인프라 수요가 한꺼번에 모인 곳이었기 때문이다. 그런데 이란 전쟁은 그 계산식의 앞자리를 바꾸고 있다.

카카오헬스케어, ‘파스타’에 혈압까지 담았다…만성질환 관리 플랫폼 확장

카카오헬스케어가 자사의 모바일 건강관리 서비스 ‘파스타(PASTA)’ 기능을 확장하며 만성질환 관리 영역을 넓혔다. 기존 혈당과 체중 중심 관리에서 나아가 혈압 데이터까지 통합하면서, 하나의 앱에서 주요 건강 지표를 종합적으로 관리할 수 있는 구조를 갖췄다.

채용 공고부터 추천까지 한 번에…AI로 묶은 ‘통합 채용 허브’ 등장

잡코리아가 AI 기반 통합 채용 솔루션 ‘하이어링 센터’를 공개했다. 채용 공고 등록부터 지원자 관리, 커뮤니케이션, 운영 관리까지 전 과정을 하나의 환경에서 처리할 수 있도록 설계된 것이 핵심이다.

정답 아닌 과정 본다…AI 활용 역량, 다면 분석으로 판별

‘AI 역량평가’는 응시자가 AI를 활용해 결과를 도출하는 과정 자체를 분석한다. 프롬프트를 설계하고, AI의 응답을 검증한 뒤 이를 보완해 최종 성과로 연결하는 일련의 단계가 평가 대상이다. 단순 정답 여부가 아니라 활용 과정의 완성도를 데이터 기반으로 측정한다는 점에서 기존 평가와 차별화된다.