AI 엑스포 2024 현장, '본격화된 생성형 AI 시대'… 온디바이스 AI, 디지털 문서, 영상인식까지

제 7회 맞이한 국제인공지능대전(AI EXPO KOREA 2024)… 다양한 분야에 생성형 AI 접목, 상용화 돋보여
챗GPT로 촉발된 생성형 AI 시대, 진화하는 LLM…텍스트, 이미지 넘어 영상까지 확대되는 기술의 격변
AI를 활용 문서 혁명 ‘사이냅소프트’, 온디바이스 음성기술 '셀바스AI', 영상인식 적용한 보안 솔루션 '씨유박스' 주목
5월 1일부터 3일까지 서울 삼성동 코엑스에서 치뤄지는 AI 엑스포 2024는 이제 단일 행사로서 아시아 최대이자 세계 5대 인공지능 전시회로 그 위상을 드높이고 있다. (사진=테크42)

챗GPT로 촉발된 생성형 AI 시대가 본격화되고 있다. 이는 올해 7회를 맞이한 국제인공지능대전(이하 AI 엑스포 2024) 현장에서 더욱 생생하게 실감할 수 있다. 지난 1일부터 3일간 서울 삼성동 코엑스에서 치뤄지는 AI 엑스포 2024는 이제 단일 행사로서 아시아 최대이자 세계 5대 인공지능 전시회로 그 위상을 드높이고 있다.

행사 이틀 째를 맞이한 현장의 열기는 첫날 못지 않았다. 지난 2018년 인공지능, 데이터 전문 기업과 연구 및 학계 관계자들로 시작된 AI 엑스포는 지속적으로 규모를 키워 올해는 글로벌 AI 워크로드를 선도하는 11개국 300여 기업 및 기관이 참여해 450여 부스 규모의 전시 및 다양한 부대 행사로 참관객들을 맞이했다.

챗GPT, 제미나이, 라마 등 대화형으로 시작된 생성형 AI 기술은 이제 다양한 분야와 접목돼 놀라운 상용화 서비스로 선보이고 있는 상황. 올해 AI 엑스포 2024에서는 이 혁신의 중심에 선 관련 국내외 생성 AI 플랫폼들의 서비스 경쟁이 특히 많은 주목을 받았다.

AI를 통한 문서 이해, 생성, 활용 기술… ‘디지털 문서 혁명’ 시작됐다

사이냅소프트는 이번 행사에서 ‘AI 기술과 함께하는 디지털 문서 혁명’을 주제로 자사의 문서 이해, 생성, 활용 전반에 도입된 AI 기술을 총망라해 선보였다. (사진=테크42)

정형, 비정형 문서의 정보를 추출하고 이를 디지털 데이터화 해 가공하는 기술은 AI를 만나며 혁명적인 발달을 지속하고 있다. 이번 AI 엑스포 역시 저마다 차별화된 기술력을 선보인 기업들의 경쟁이 눈에 띄었다.

특히 인공지능 디지털 문서 SaaS 기업을 표방한 사이냅소프트의 경우는 이번 행사에서 ‘AI 기술과 함께하는 디지털 문서 혁명’을 주제로 자사의 문서 이해, 생성, 활용 전반에 도입된 AI 기술을 총망라해 선보였다. 사이냅소프트는 디지털 문서 분석 및 추출, 인식 분야에서 24년간 노하우를 축적해 온 기술 기업이다.

이날 사이냅소프트 행사 부스는 AI OCR(광학문자인식), 사이냅 도큐애널라이저, 문서뷰어, DU, 에디터, 오피스 등 제품을 직접 체험하고 설명을 듣기 위해 모인 인파로 북적였다.

오효원 사이랩소프트 대리는 “AI OCR은 TTA에서 진행하는 공공행정 문서를 대상으로 99% 정확도 인증을 받았다”며 “정형화된 행정 문서 외에도 사진, 스캔 이미지 등 다양한 형태의 비정형 문서도 높은 정확도를 자랑하고 있다”고 강조했다. (사진=테크42)

현장에서 만난 오효원 사이랩소프트 대리는 “AI OCR은 TTA에서 진행하는 테스트에서 공공행정 문서를 대상으로 99% 정확도 인증을 받았다”며 “정형화된 행정 문서 외에도 사진, 스캔 이미지 등 다양한 형태의 비정형 문서도 높은 정확도를 자랑하고 있다”고 강조했다.

특히 이번 전시회에서 첫 선을 보인 ‘사이냅 도큐애널라이저’는 큰 주목을 받고 있다. 이는 AI가 학습하기 쉬운 형태로 문서 구조 정보를 추출하는 솔루션으로 AI 학습 가공 데이터를 구축하는데 적용할 수 있다. 이와 관련 오 대리는 “제목과 머리말, 각주, 페이지 번호, 다단 구조 등 다양한 문서의 요소는 물론 한글, 워드 혹은 이미지로 돼 있는 포맷과 상관 없이 적용가능하다”며 특징을 소개했다.

“다양한 형태, 포맷의 문서에 담긴 데이터를 AI가 학습하기 위해서는 텍스트도 추출해야 하는데 이때 원본 문서의 구조나 요소들을 파악하고 정확하게 추출해야 하죠. 도큐애널라이저는 문서 안에 텍스트를 추출하면서도 각각의 텍스트가 제목인지, 머리말인지 등의 정보까지 정리해 XML과 마크다운 형태로 가공합니다. 이를 그대로 AI 학습에 적용하실 수도 있고 원하는 것만 선별할 수도 있죠.”

다양한 디바이스는 물론 앱 서비스에도 적용 가능한 온디바이스 AI 음성 기술

'TREND.X'를 슬로건으로 내걸고, 트렌디한 AI 기술로 다양한 고객과 함께 비즈니스 현장에서 만들어 나가고 있는 디지털 전환 사례를 소개한 ‘셀바스AI’의 온디바이스 AI 기술이 참관객의 관심을 사로잡았다. (사진=테크42)

최근 삼성전자가 갤럭시S24에 세계 최초로 온디바이스 AI를 적용해 화제가 되고 있다. 이번 ‘AI 엑스포 2024’ 역시 다양한 온디바이스 AI 기술을 선보이는 기업들이 눈에 띄었다. 그 중 'TREND.X'를 슬로건으로 내걸고, 트렌디한 AI 기술로 다양한 고객과 함께 비즈니스 현장에서 만들어 나가고 있는 디지털 전환 사례를 소개한 ‘셀바스AI’의 온디바이스 AI 기술이 참관객의 관심을 사로잡았다.

특히 셀바스AI가 선보인 온디바이스 음성기술은 음성기술 경량화에 성공, 스마트폰은 물론 테블릿, 노트북, 키오스크, 로봇 등 다양한 디바이스에 바로 적용할 수 있다는 점에서 주목받았다. 이는 온디바이스 기술인 만큼 서버 및 클라우드 연결이 필요하지 않아 정보 보안에 특화돼 있고, 인터넷 연결 없이도 안정적인 서비스를 제공할 수 있다는 것이 특징이다.

이날 셀바스AI는 온디바이스 음성기술이 적용된 다양한 솔루션을 선보이며 참관객들의 관심을 사로잡았다. (사진=테크42)

현장에서 만난 김은주 셀바스AI 이사는 “삼성전자의 갤럭시S24로 온디바이스 AI가 화두가 되기 시작했고 이후 다양한 디바이스에 접목하고자 하는 니즈가 있는 상황”이라며 특징을 설명했다.

“저희가 선보이는 온디바이스 음성기술은 음성 인식과 합성 기술을 기반으로 하고 있어요. 인터넷이나 네트워크 환경이 없는 상황, 스마트폰이 아닌 태블릿이나 키오스크, 전자책 디바이스에서도 책을 읽어주거나 음성을 인식하는 니즈들이 많이 생기고 있습니다. 특히 저희 기술은 디바이스 외에도 온라인 서비스 등에 앱 형태로 인스톨 된다는 것이 특징이예요. 가령 전자책 앱을 실행할 때 음성합성 기술이 동시에 적용되는 거죠.”

한편 이날 셀바스AI는 이러한 온디바이스 음성기술이 적용된 AI 음성기록 제품 '셀비 노트(Selvy Note)', 디지털 교육 환경에서 영어 교육을 돕는 AI 교육 음성인식 솔루션 '셀비 스피치에듀(Selvy SpeechEdu)', 영상의학과 및 응급의료센터 등 의료진의 기록업무 효율화를 위한 AI 의료 음성기록 제품 '셀비 메디보이스(Selvy MediVoice)' 등 다양한 솔루션을 소개하기도 했다.

정보 보안에 적용되는 영상인식 기술 주목

‘씨유박스’는 AI 영상인식 전문기업으로서 독자적인 생성형 AI 서비스인 ‘AI 프로필 메이커’ 영상인식 기반의 AI 보안 솔루션 ‘씨유 온(SEEU ON)’을 선보였다. (사진=테크42)
‘AI 프로필 메이커’는 참관객의 인기를 독차지했다. 이는 대규모 데이터셋 학습을 기반으로 한 자체 생성형 AI 서비스로 단 한장의 사진만 있으면 0,5초 만에 고품질의 프로필 이미지를 확인할 수 있다. (사진=테크42)

이날 AI 엑스포 2024에서는 생성형 AI와 영상 기술을 접목한 솔루션을 선보이는 기업들 역시 많았다. 이중 ‘씨유박스’는 AI 영상인식 전문기업으로서 독자적인 생성형 AI 서비스인 ‘AI 프로필 메이커’ 영상인식 기반의 AI 보안 솔루션 ‘씨유 온(SEEU ON)’을 선보였다.

B2C 방식의 시제품으로 선보인 ‘AI 프로필 메이커’는 참관객의 인기를 독차지했다. 이는 대규모 데이터셋 학습을 기반으로 한 자체 생성형 AI 서비스로 단 한장의 사진만 있으면 0,5초 만에 고품질의 프로필 이미지를 확인할 수 있다.

한편 ‘씨유 온’의 경우는 AI 영상인식 기반의 실시간 정보 보안 솔루션이다. 이 솔루션을 적용하면 더 이상 아이디, 비밀번호를 치거나 지문인식 등을 할 필요가 없게 된다. 여기에 더해 사용자가 자리를 비운 상황에서 등록되지 않은 다른 사람이 화면을 보거나 카메라 및 핸드폰으로 화면을 촬영할 경우 실시간으로 모니터 화면을 차단, 정보유출을 방지한다.

현장에서 만난 한병현 씨유박스 프로는 “간단한 얼굴 인증을 통해 개인 노트북 환경의 보안을 강화한 것이 특징”이라고 설명했다. (사진=테크42)

현장에서 만난 한병현 씨유박스 프로는 “간단한 얼굴 인증을 통해 개인 노트북 환경의 보안을 강화한 것이 특징”이라고 설명했다.

“사용자 얼굴 인증을 통해 자리비움 상황에서 카메라를 통해 화면을 촬영하는 것은 물론 다른 사람이 화면을 보는 것 조차도 차단할 수 있어요. 또 웹캠을 가리는 것도 탐지를 해 화면을 차단하죠. 개인이 사용하는 환경은 물론 기업 차원에서도 정보 유출을 방지할 수 있는 솔루션입니다. 특히 첨단 기술 기업들이 직원들의 재택근무 등에서 보안을 위해 적용하고 있습니다.”

한편 이번 AI 엑스포 2024에서는 이들 기업 외에도 'AI Elemental Technologies·H/W·S/W' 분야 생성AI, 대형언어모델(LLM, sLLM), 설명 가능한 AI, 머신러닝, 딥러닝, 메타러닝, 제로샷러닝, 강화학습, 자연어처리(NLP), 음성 인식, 이미지 인식, 영상 인식 기술 기업이 다수 참여하며 현장의 열기를 더했다.

생성형 AI 스타트업 포티투마루 부스. 포티투마루는 이날 행사에서 도메인 특화 초거대 언어모델인 'LLM42'를 비롯해 LLM 상용화 핵심 요소인 'RAG42' 솔루션을 소개했다. 이 외에도 초거대 언어모델 기반의 생성형 AI 서비스 상용화 사례를 소개하며 참관객의 이목을 집중 시켰다. (사진=테크42)
이번 행사에서 마음AI는 비주얼 파운데이션 모델 기반의 자율주핸 기술 '워브', 오디오 파운데이션 모델 '수다' 등을 소개하며 대규모 부스를 운영했다. (사진=테크42)

황정호 기자

jhh@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

‘테크 이지 토크’ 첫 번째 시간… LLM의 미래와 교육의 변화

산업 각 분야에서 초거대언어모델(LLM, Large Language Model)을 활용한 기술과 서비스가 앞다퉈 등장하고 있다. 과연 LLM의 강점과 한계는 무엇일까? 그리고 여러...

‘챗GPT’ 뉴 버전 ‘섹시한 페르소나’는 마음에 드나요?

스칼렛 요한슨이 디지털 동반자의 목소리를 맡은 영화 이 실제로 구현됐다. 오픈AI는 섹시한 여성 목소리의 인공지능 대규모 언어모델 ‘GPT-4o’를 새롭게 공개했다. 기업이 끊임없이 강조하는 대로 챗GPT는 미래를 건설하고 있는 것일까.

[인터뷰] 매도왕 정철민 대표·임주성 CTO “1년 동안 안 팔렸던 매물, 두 달만에 팔리는 부동산 솔루션을 개발했습니다”

‘프롭테크(PropTech, 부동산에 기술을 결합한 서비스)’를 내세운 다양한 서비스가 생겨나고 있지만, 정작 매수자나 세입자 중심의 서비스가 대부분을 차지하고 있는 것도 한계점으로 작용하고 있다. 이러한 상황에서 지난달 초 엔틀러 코리아의 액셀러레이팅 프로그램을 통해 탄생한 신생 스타트업 ‘매도왕’은 그 사명과 같이 매도인 입장에서 부동산 매물이 잘 팔릴 수 있는 솔루션을 제시하며 주목받고 있다.

AI 스타일링 서비스 운영 스타일봇, 파리 'VIVA TECH 2024' 서 최초 공개

스타트업 스타일 봇은 프랑스 파리에서 열리는 'VIVA Technology 2024' 전시회에서 매장 및 온라인에서 모두 사용 가능한 혁신적인 AI 패션 스타일링...