AI 챗봇 발전의 역설... "더 똑똑해질수록 오답 가능성 높아져"

An unexpected side effect of AI chatbot development has been discovered. A research team from the Polytechnic University of Valencia in Spain has revealed that as AI models advance, their accuracy improves, but simultaneously, the likelihood of providing incorrect answers to questions beyond their capabilities increases. The research team tested various AI models, including OpenAI's GPT series, Meta's LLaMA, and the open-source BLOOM, with questions on diverse topics. As a result, they found that as models became more advanced, the rate of providing incorrect answers instead of saying "I don't know" increased. Even more concerning is that users often misidentify these incorrect answers as accurate. According to the study, developers participating in the test mistakenly judged 10-40% of AI's inaccurate responses as correct. In conclusion, it is essential to verify the accuracy of responses when using AI chatbots, and we must be cautious that indiscriminate trust can lead to the spread of misinformation.

AI 챗봇 발전의 예상치 못한 부작용을 발견됐다. 스페인 발렌시아 공과대학의 연구팀은 AI 모델이 발전할수록 정확도가 높아지지만, 동시에 자신의 능력을 벗어나는 질문에도 잘못된 답변을 할 가능성이 증가한다고 밝혔다. 연구팀은 오픈AI의 GPT 시리즈, 메타의 LLaMA, 오픈소스 BLOOM 등 여러 AI 모델을 대상으로 다양한 주제의 질문을 테스트했다. 그 결과, 모델이 발전할수록 "모르겠다"고 답하는 대신 잘못된 답변을 제시하는 비율이 높아졌다. 더욱 우려되는 점은 사용자들이 이러한 잘못된 답변을 정확하다고 오인하는 경우가 많다는 것이다. 연구에 따르면, 테스트에 참가한 개발자들은 AI의 부정확한 답변을 10~40% 정도 정확하다고 잘못 판단했다. 결론적으로, AI 챗봇 사용 시 답변의 정확성을 반드시 확인해야 하며, 무분별한 신뢰는 잘못된 정보 확산으로 이어질 수 있음을 경계해야 한다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

앤트로픽, 새 모델 아닌 워크플로로 승부…'클로드 사이언스' 공개

앤트로픽이 새 모델이 아닌 작업 환경으로 과학자를 공략한다. 클로드 사이언스는 기존 클로드 모델로 60개 이상 데이터베이스를 연결하고, 팩트체크 AI로 인용과 계산을 검증한다.

구글, 4초 만에 이미지 만드는 '나노 바나나 2 라이트' 공개

구글이 가장 빠르고 저렴한 이미지 생성 모델 나노 바나나 2 라이트와 영상 생성·편집 모델 제미나이 옴니 플래시를 개발자에 공개했다. 이미지는 4초, 영상은 초당 약 155원으로 제작 가능하다.

수수료 없는 스테이블코인 '오픈USD' 출범...서클 USDC에 도전장

비자·스트라이프·코인베이스·마스터카드·블랙록 등 140여 개 기업이 준비금 수익을 나누는 새 스테이블코인 '오픈USD' 컨소시엄에 합류했다. 수수료·물량 한도 없이 올해 하반기 출시 예정.

앤트로픽, '클로드 소네트 5' 출시…에이전트 AI 정조준

앤트로픽이 자율 작업형 AI '클로드 소네트 5'를 공개했다. 무료·프로 기본 모델로 탑재되고, 가격은 오퍼스 4.8보다 저렴하다.