당신의 차도 터치스크린 대신 ‘키트’처럼?···딜레마에 빠지다

2023.02.14

^{1968년 출시된 스탠리 큐브릭 감독의 전설적인 영화 ‘2001:스페이스 오디세이’에 등장하는 인공지능 음성비서 ‘할(HAL)’은 말하는 AI로서 그 위험성을 극명하게 보여주었다. (사진=MGM)}

조만간 드라마 ‘전격제트대작전(원제: Night Rider·1983)’ 속 ‘키트(KITT)’같은 대화형 자동차의 꿈이 실현될 수 있을까. 널리 알려져 있다시피 미국 NBC방송국 드라마 전격 제트 대작전은 1980년대에 국내에서도 방영돼 큰 인기를 얻었다. 이 드라마에 등장하는 자동차 ‘키트’는 위기일발인 주인공 마이클의 탈주를 돕고 악당을 물리치는 데도 한몫 한다. 이 인공지능(AI) 자동차는 마이클과 음성 대화도 한다.

최근 우리 주변 차량들의 많은 부분이 점차 자동화, 자율화되고 있는 가운데 일부 차량의 기능 제어 방식에도 변화의 움직임이 보인다. 몇몇 차량에서 터치스크린 제어기능의 일부가 양호한 수준의 음성 제어시스템으로 바뀌기 시작했다. 드라마 속 키트 수준까지는 아니지만 간단한 대화와 음성명령 방식의 차량 제어를 수행한다. 이에 이 차량내 음성제어가 터치스크린 제어를 대체할 수 있을지에 대한 논의도 고개를 들고 있다.

과연 차량 음성 제어의 보편화는 가능할까. 일각의 긍정론과 부정론이 엇갈리는 듯 하다. 터치스크린 제어방식은 운전 중 문자메시징보다는 덜하지만 운전자 주의력을 빼앗아가는 것을 우려하는 측에서는 이 방식의 도입에 일단 긍정적이다.

부정론도 나온다. 너무 앞서 나간 것일 수도 있지만 음성제어가 제대로 안돼 사고가 날 만일의 경우에 대한 우려가 그것이다. 우리는 SF영화의 선구작으로 여기는 ‘2001:스페이스 오디세이(1968)’에서 우주선내에 탑재된 인공지능(AI)인 ‘할(HAL)’의 배신을 기억한다. 많은 이들은 영화속 ‘할’이 자신의 작동을 멈추려는 인간(우주비행사)을 사망에 이르게 하는 영화속 장면을 기억한다. 이같은 나쁜 가능성에 대한 기억이나 경험은 사람들이 차와 음성으로 대화하고 이를 통해 차량을 제어하는 것을 방해한다.

아스테크니카는 최근 BMW가 차량내 터치스크린 제어를 음성제어로 바꾼 사례와 함께 이를 둘러싼 편리함과 위험성, 그리고 해결과제를 제기했다. 차량 음성제어 대체 및 도입 확산 가능성에 대한 논의에 불을 지핀 셈이다.

인류는 이제 날로 인포테인먼트화되는 차량내 터치스크린을 음성 제어 시스템으로 바꿔가는 길목에 서 있다. 동시에 기술 개발 진전에 따른 문제점을 논의하고 대책을 함께 마련하면서 활용하는 방안을 본격적으로 논의해야 하는 시점에 와 있다.

차량내 인포테인 터치스크린 급증

^{미 NBC의 1983년 드라마 ‘전격제트대작전’에 등장한 AI자동차 키트의 음성제어부. (사진=NBC 트레일러)}

지난 10여 년 동안 자동차는 종종 복잡한 사용자 인터페이스(UI)를 가진 상당히 복잡한 기계가 됐다. 업계 대부분의 회사가 사실상 유비쿼터스 인포테인먼트 화면에 터치 기능을 추가했다.

자동차 제조사들은 터치 스크린 UI가 운전자 주의력을 더 산만하게 만든다는 많은 증거가 있음에도 개의치 않고 스크린에 더 유연한 UI를 덧붙이려 애쓰고 있다. 제조를 더 단순하고 저렴하게 만들 수 있기 때문이다.

하지만 최근 등장하는 여러 신차에서 발견했듯이 더 나은 방법이 있다. 말 그대로 큰 소리로 작동을 지시하는 방식이다.

자동차 음성제어는 거의 무용한 수준에서 시작해 몇 년을 보내면서 마침내 최소한 어떤 면에서는 정말로 좋아졌다.

전격제트대작전 속 키트 같은 AI 자동차가 “미안해요, 데이브, 그럴 수 없어요”라고(드라마에서처럼) 말대꾸하는 대신 당신의 발음과 억양을 이해하고, 서로 대화하고, 당신이 말로 요청하는 것을 실행시켜 준다면 어떤 기분이 들까. 얼마나 편리할까.

그런데 이게 현실이 되고 있다.

BMW 등이 제대로 된 음성 명령 자동차 물꼬를 트다

^{메르세데스 벤츠 MBUX에는 음성 명령제어 기능이 들어가 있다. (사진=메르세데스 벤츠)}

최신 메르세데스-벤츠 MBUX나 BMW 아이드라이드 8 운전자들에게 상상은 상상에서 멈추지 않는다. 이 두 회사의 최신 차량은 음성제어시스템을 적용한 차량의 일부에 지나지 않는다.

이 차량들 가운데 일부는 대부분의 기능 작동을 위해 터치스크린을 누를 필요가 없다. 메르세데스 벤츠 일부 차량에서는 “헤이 메르세데스”라는 말로 음성제어를 시작할 수 있다.

물론 아주 일반적인 명령만을 사용할 수 있다.

예를 들어 차에 대해 “춥다(I’m cold)”고 말하면 실내 온도를 올려 준다. 더 구체적으로 “앞좌석 온도를 75도(섭씨 24도)로 설정해 줘”라든가 “좌석 히터를 레벨 2로 켜 줘”라고 말하는 것이 터치 스크린의 어느 부분을 눌러야 하는지 기억하는 것보다 훨씬더 쉽다. 차량내 음성 인식은 심지어 운전자가 특정 주소로 이동하라고 말할 때 운전자의 말을 이해할 수 있을 정도로 좋다. (*영국 바이어카닷컴은 지난해 4월 최고의 음성제어 차량 8종으로 포드 피에스타, 스코다 카믹크, 메르세데스 A클래스, 현대 이오닉, 폴크스바겐 티구아나, BMW 3시리즈, 아우디 A6, 포르셰 샤이엔 등을 꼽았다. )

세렌스 같은 음성명령 인식 수행회사들 등장

^{BMW나 메르세데스-벤츠같은 음성명령 제어 시스템을 갖춘 편리한 차량 출시에는 음성명령 인식 기술 개발 회사들이 한몫하고 있다. 세렌스는 얼굴인식가 음성인식을 바탕으로 한 대화형 AI비서이며, 차량 통행요금 서비스 명령까지 수행한다. (사진=세렌스)}

BMW와 메르세데스-벤츠, BYD, 르노, 빈패스트 등에 이같은 음성 제어용 비서를 공급하는 세렌스(Cerence)는 그 공이 자신들에게 돌아가야 할 것이라고 말한다.

많은 차량들에서 여러 소프트웨어(SW)가 실행되기 때문에 구글의 안드로이드 오토모티브 OS를 사용하는 자동차들이 사용하지 못하는 기능에 접근할 수 있다. 게다가 한 때 알려졌던 구글의 음성 비서는 어떤 이유에선지 지난 12개월 동안 음성을 이해하는 기능이 더 나빠진 것처럼 느껴진다.

전격제트대작전의 주인공 키트와 마이클 나이트의 모험과 함께 성장한 시대의 컴퓨터 괴짜들조차도 아무도 자신들의 차와는 얘기하고 싶어하지 않는 것처럼 보인다.

왜 그럴까. 그 이유 중 일부는 앞서 언급한 것처럼 좋은 음성 제어 시스템이 아직 광범위하게 보급되지 않았다는 점이다.

2.3톤짜리 자동차는 스마트폰과 같지 않다

^{분명 자동차는 스마트폰과는 다르다. 전격제트대작전에 등장하는 것처럼 항상 AI 음성 비서가 고장이나 이상없이 인간에게 좋은 쪽으로만 서비스하게 될 것이라고 보장할 수 있을까. (사진=NBC 트레일러)}

베티 버너 노던 일리노이 대학 언어학 및 인지과학 교수는 “나는 그 이유중 일부는 언어에 본질적으로 사회적인 그 무언가가 있기 때문이라고 생각한다. 수천 년 동안 그것은 본질적으로 사회적 시스템으로 발전해 왔다. 그래서 나는 인간 속에 또 다른 ‘지각 있는 존재가 아닌 것’과 대화하는 것을 주저케 하는 무언가가 있다고 생각한다”고 말했다.

그녀는 “우리는 우리의 개들과 이야기하겠지만 토스터하고 이야기하고 싶지 않을 수도 있다. 그래서 나는 그것이 그런(음성비서와 대화하길 주저케 하는) 이유의 일부분이라고 생각한다. 우리는 의사소통을 위해 언어를 사용하고, 의사소통이 무엇을 의미하는지에 대한 개념을 가지고 있다. 그리고 그것(상대)은 다른 마음(을 가진 상대)을 의미한다. 맞는가? 내 마음이 당신들의 마음과 소통하는 것이다”라고 말했다.

버너 교수는 “또 다른 분명한 것은 당신의 차가 당신을 죽일 수 있다는 것이다. 당신의 토스터가 당신을 죽일 수도 있지만 그러기 위해서는 정말 열심히 해야 한다. (반면)자동차는 정말 위험하다. 그래서 당신은 인공지능(AI)을 정말로, 정말로 신뢰할 필요가 있다. 나는 사람들이 AI와 자연어 처리가 얼마나 발전했는지 이해하지 못할 것이라고 생각한다. 그리고 그들은 그것에 자신의 생명을 맡길 정도로 그것들을 신뢰하지는 않을 것이다. 당신도 알다시피 그건 이해가 된다”고 말했다.

음성 인터페이스가 주의를 산만하게 한다?···확산의 조건

^{연구결과에 따르면 차량내 음성제어 인터페이스는 운전자의 주의를 산만하게 할 수 있다. (사진=메르세데스 벤츠)}

게다가 차량 제어용 음성 인터페이스에 대한 연구결과를 보면 음성 인터페이스는 일반적인 생각과 달리 운전자의 주의를 산만하게 할 수 있다는 것을 말해준다.

지난 2015년 미국자동차협회(AAA)의 지원을 받은 연구에서는 운전자가 전화나 자동차에 음성 명령을 내린 후 주의력을 완전히 회복하는 데 최대 27초가 걸린다는 사실을 발견했다. 같은 해에 같은 그룹의 또다른 연구에서는 당시의 여러 인포테인먼트 시스템을 테스트한 후 음성 인식 능력이 매우 부적절하다는 것을 발견했다. (물론 현재는 상당히 발전했다.)

댄 맥기 미국 아이오와 대학 미 첨단 운전 시뮬레이터 소장은 “우리는 설계자로서 음성 입력을 하는 동안 정면을 바라봐야 한다고 생각하지만, 실제로는 사람들이 마이크나 인터페이스가 있는 곳을 보는 것으로 드러났기 때문에 이들은 말할 때 도로에서 눈을 떼고 있다”고 말했다.

지난 10년 동안 기술이 크게 발전했지만, 산만한 운전에 대한 연구는 이를 따라잡지 못했다.

댄 맥기 소장은 “그것은 이전 세대의 시스템이었고 어렵다. 우리가 연구자로서 해야 할 일은 이러한 시스템을 사용하는 동안 사람들의 태도와 눈의 움직임, 시선 추적을 살펴보는 종단적인 연구다”라며 “자금 지원 기관들은 그 연구에 돈을 지불해야 하는 꽤 설득력 있는 이유를 원할 것”이라고 덧붙였다.

아마도 그것은 대중의 의식에 스며들 시간이 필요할 것이다.

맥기 소장은 “나는 스마트폰이 우리 사회와 심지어 전 세계 어디에나 있기 때문에 사람들이 음성 텍스트를 하고 싶은지 여부와 상관없이 그런 종류의 인터페이스에 대해 천천히 배우고 있다고 생각한다. 어떤 사람들은 그것을 꽤 많이 사용하지만, 어떤 사람들은 그것을 할 수 있는지조차 모른다. 그래서 받아들이는 데 시간이 좀 걸린다”고 말했다.

이전 연구가 버려진 이유···긴급상황 목소리 이해 못할 수도

적어도 가까운 미래에는 승용차에서 ‘전면적인’ 음성 인터페이스 지점에 도달하지 못할 것이다.

일부 제어 장치(특히 비상 시 사용해야 할 수 있는 제어 장치)의 경우에는 물리적인 것이 선호될 것이다. (영화 ‘2001: 스페이스 오디세이(1968)’에서 제기한 ‘할’의 위험성 같은 것)

맥기는 “정말 흥미로았던 것은 사람들이 우리를 이해하지 못하는 누군가와 이야기를 하는 것처럼 목소리를 높이고 목소리 억양을 바꾸고 싶어한다는 것이다. 그리고 물론 그것은 음성 시스템으로 할 수 있는 최악의 일이다”라고 지적했다.

그는 “앞서 나는 30여 년 이상 보잉사의 상업화 부서에서 조종석 설계자로 일했고, 음성을 사용하려는 첫 시도가 그곳에서 시험되고 있었다. 그리고 그들은 특히 긴급 상황에서, 목소리가 변하고, 그 변화들이 컴퓨터가 당신의 말을 해석하는 데 영향을 미칠 수 있다는 것을 발견했고, 그것은 단지 그것 때문에 버려졌다”고 밝혔다.

어느 자동차 회사와 차량용 음성제어시스템 회사가 이 문제를 해결할 것인가 지켜봐야 하겠다.

#2001:스페이스 오디세이 #BMW #Night Rider #메르세데스 벤츠 #세렌스 #음성 명령제어 #음성 제어용 비서 #인공지능 음성비서 #전격제트작전 #키트 #할

이재구 기자

jklee@tech42.co.kr

기자의 다른 기사보기