시민 데이터 과학자와 AutoML..."AI 어렵지 않아요"

최근 AutoML 도구를 찾는 이들이 늘고 있다.

AutoML은 다양한 선택지가 있다. 공용 클라우드 서비스를 이용할 수도 있고, 상용 도구를 고를 수도 있다. 결국 사용 용도와 조건, 사용 중인 인프라 환경 그리고 비용 등을 고려하여 선택할 수 있다.

그렇다면 AutoML을 찾는 이유는 무엇일까?

모델 생성과 트레이닝은 모델 최적화, 경량화 등의 목표에 한걸음씩 다가서는 반복적인 과정이다. 지루하고 단순한 이 작업을 자동화하여 머신 러닝 프로젝트의 생산성을 높이는 것이 바로 AutoML을 찾는 이유다.

 

시민 데이터 과학자가 AI 프로젝트에 참여할 수 있도록 

AutoML을 찾는 이유는 또 있다. 모델 생성과 트레이닝을 꼭 데이터 과학자의 일로만 볼 것인가? 데이터 과학자가 아닌 도메인 전문가가 직접 뭔가 해볼 수는 없을까?

이런 궁금증에 대한 속시원한 답을 AutoML이 제시한다. AutoML 도구는 지향점은 다르지만 대부분 누구나 손쉽게 모델을 생성하고 트레이닝하는 것에 초점을 맞춘다. 관련하여 업계에서는 AutoML을 ‘시민 데이터 과학자(Citizen Data Scientist)가 AI 프로젝트에 주도적으로 참여할 수 있도록 돕는 플랫폼’이라고 소개한다.

시민 데이터 과학자는 고급 진단 분석 또는 예측 및 규범적 기능을 사용하는 모델을 만들거나 생성할 수 있으나, 주 업무는 통계 및 분석 분야가 아닌 사람으로 정의한다.

시민 데이터 과학자가 조직에 많을 수록 나쁠 것은 없을 것이다. 코딩을 몰라도 된다. 비즈니스 데이터에 대한 이해만 있어도 충분하다. 피쳐 엔지니어링과 머신 러닝 트레이닝은 플랫폼이 알아서 처리한다.

사실 이런 접근은 데이터 쪽에서 새로운 것이 아니다. 비즈니스 인텔리전스(BI)가 유행하던 시절 셀프 서비스 BI를 강조하던 업체들이 꽤 많았다. 통계 전문가, 데이터 전문가가 아니더라도 누구나 고급 비즈니스 분석을 할 수 있어야 한다고들 입을 모았다. 이게 AI 분야에서도 똑같이 일어나고 있는 것이다.

사진=LG CNS 블로그
사진=LG CNS 블로그

 

AutoML, 데이터 과학자의 영역을 보편적 업무로...

AutoML은 데이터 과학자의 업무 영역이던 모델 생성과 트레이닝을 현업 담당자, 개발자, BI 전문가 등 다양한 이해관계자도 수행할 수 있는 보편적인 업무로 만들고자 시도 중이다.

이것이 어느 정도 성공할지 아직은 확신할 수 없지만, 앞서 이야기한 것과 같이 AI 프로젝트에 관심을 갖고 참여하는 이가 많을 수록 비즈니스 측면에서 나쁠 것 없어 보인다.

물론 한계는 있을 것이다. 데이터와 기술은 언제나 ‘닭이 먼저냐 혹은 달걀이 먼저냐’의 문제와 비슷하다. 풍부한 도메인 지식을 바탕으로 데이터를 바라보는 이가 모델 생성과 트레이닝에 더 유리한 것은 맞다. 하지만 데이터 과학에 대한 전문 지식이 없다면 최적의 모델을 끌어 내는 데에는 한계가 있을 것이다.

데이터 과학자 역시 AI 전문성은 높지만 모든 도메인을 이해할 수 없다. 즉 서로가 서로의 전문성을 존중 하는 가운데 부족한 점을 훈련을 통해 채워 나가는 노력이 필요하다.

AutoML이 추구하는 시민 데이터 과학자 개념이 성공하려면 적절한 훈련과 교육에 대한 노력도 있어야 하지 않을까?

김성태

sungtai@uclick.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

이제는 AGI를 준비해야 할 시기

이제는 생성형 인공지능을 뛰어넘는 범용 인공지능을 언급하는 시대가 도래하고 있어요. 여러 분야에 두루 쓰이는 인공지능이라면 인공지능을 필요로 하는 기업들의 까다로운 입맛에 잘 맞춰줄 수 있지 않을까요?

쿠팡은 와우 멤버십 가격을 왜 올린 걸까요?

작년 연말 기준으로 쿠팡 와우 멤버십 회원 수는 약 1,400만 명으로 알려져 있습니다. 2021년 말 무려 70%나 와우 멤버십 가격을 올렸을 때도, 회원 수가 줄기는커녕 더욱 늘어났는데요. 다만 이제는 현재 수준의 혜택으로 이 이상 멤버십 회원 수를 키우는 건 어렵다고 판단한 것이 아닐까 싶습니다. 그래서 결국 수익 확대의 길을 택하게 된 것일 거고요.

형편없는 글 솜씨 때문에 직장생활이 힘겹다면?

비즈니스 글쓰기는 다릅니다. 기본적인 3가지 원칙을 지켜 반복 훈련하면 글 솜씨를 훨씬 발전시킬 수 있는데요. 그럼 상사 속 터지게 만드는 대표적인 비즈니스 글 3가지 유형을 살펴보고, 이런 글을 쓰지 않기 위해 명심해야 할 세 가지 원칙을 확인해볼까요?

티빙은 왜 한국프로야구 온라인 중계권을 샀을까?

왜 티빙은 3년 계약에 1,300억이 넘는 큰 금액을 투자해서 이 권리를 구매했을까요? 3년에 1,300억은 1년에 400억이 훨씬 넘는 금액을 투자한 것인데 그만큼의 가치가 있는걸까요? 기존에 온라인 중계권을 가지고 있던 네이버와 통신사 등의 컨소시엄보다 더 큰 금액을 투자해서 티빙은 무엇을 얻고자 하는걸까요?