오늘날 AI의 지능 수준은 어느 정도일까?

 

 

인공지능을 바라보는 많은 이들의 시선은 엇갈린다. 혹자는 두려워할 것 없다며 무시하지만, 또 다른 이는 인공지능이 우리를 파멸시킬 것이라 한다. 학자들 사이의 의견도 엇갈린다. 인공지능 4대 천왕이자, 딥러닝의 대부라 불리는 제프리 힌튼의 경우 인공지능을 경계해야 한다는 주장을 하고 있지만, 역시나 4대 천왕에 속하는 얀 르쿤의 경우 지금의 인공지능 기술이 인간 수준까지 발전하려면 아직 멀었다며, 5년 내 인간 수준의 인공지능이 등장한다는 전망은 틀렸다고 단언한다.

 

그런 와중에 구글 딥마인드의 CEO인 데미스 허사비스가 현대 인공지능의 수준을 집고양이에 비유한 이야기가 주목받고 있다. 딥마인드의 공동 창립자이자 CEO인 허사비스는 지난 7월, 영국의 전 총리 토니 블레어와의 공개 토론에서 이 같은 발언을 했다. 구체적으로 살펴보자.

 

허사비스는 딥마인드의 인공지능 개발 진척도에 대한 질문에 “우리는 아직 고양이의 지능에도 도달하지 못했다”라고 언급했다. 현대의 인공지능이 때로는 인간처럼 글을 쓰고, 음악을 만들고, 그림을 그리지만, 현실 세계를 이해하는 면에서는 고양이에도 미치치 못한다는 것이 허사비스의 주장이다. 그러면서, “현재로서는 모든 면에서 인간 수준의 지능에 도달하기 멀었다”라고 허사비스는 인정했다. 물론 게임 등 특정 영역에서는 인공지능이 세계 최고의 인간보다 뛰어나다는 이야기를 덧붙인다. 바둑에서 이세돌 9단을 이긴 알파고를 만든 이 다운 발언이다.

 

 

토니 블레어 전 총리와 공개 토론을 하는 데미스 허사비스, 구글 딥마인드 CEO

 

 

여기까지만 보면, 허사비스가 얘기하는 인공지능은 갈 길이 멀어 보인다. 하지만, 허사비스는 인공지능의 미래를 낙관적으로 보고 있다. 자극을 추구하는 기사에서는 ‘고양이’라는 특정 단어에만 집중하고 있지만, 허사비스가 얘기하고자 하는 바는 지금은 고양이지만, 빠른 발전이 일어나고 있다는 것이 핵심 포인트였다.

 

허사비스는 딥마인드의 연구가 사람처럼 생각하며, 어느 분야에서도 범용적으로 활용할 수 있는 ‘인공일반지능(AGI, Artificial General Intelligence)’에 초점을 맞추고 있다고 강조했다. 현재 연구는 빠르게 진행 중이며, 아직 고양이의 지능에 도달하지는 못했지만, 막대한 자금과 컴퓨팅 자원의 투자로 발전은 가속화하고 있다.

 

인공지능이 우리의 삶에 미칠 잠재력에 대해 허사비스는 산업 혁명이나 전기의 활용만큼이나 큰 변화를 일으킬 것이라고 자신 있게 말한다. 특히 그는 인공지능이 에너지, 재료 과학, 건강, 기후, 수학 등에서 과학적 발견을 가속화하는 데 큰 역할을 할 것이라 생각하며, 이미 이러한 변화가 시작되었다고 언급한다. 실제로 그가 CEO로 있는 구글 딥마인드는 단백질 구조 분석을 성공적으로 완수하며, 예비 노벨상인 래스커상을 2023년에 수상한 바 있다.

 

딥마인드는 궁극적으로 AGI를 목표로 하고 있다. 허사비스는 토니 블레어와의 대담 자리에서 구글 딥마인드의 프로젝트 아스트라(Project Astra)에 대해서도 소개하였다. 이 프로젝트는 인공지능을 단순 챗봇 이상으로 탈바꿈시켜 사용자의 상황이나 환경, 선호도, 과거 이력 등을 기반으로 능동적으로 동작하는 ‘범용 AI 에이전트’를 제공하는 것을 목표로 한다. 일상생활에서 유용한 도움을 주는 인공지능 에이전트 제공을 목표로 하고 있는 것이다.

 

 


 

 

챗GPT를 개발한 오픈AI 역시 AGI 달성을 사명으로 하고 있다. 오픈AI는 설립 당시부터 이를 공언하였으며, 자사가 아닌 타 회사에서 AGI를 먼저 달성할 경우, 경쟁하지 않고 그 프로젝트를 도울 것이라고 사명에 명시하고 있다. 이를 위해서는 AGI가 무엇인지에 대한 기준을 확립하는 것이 중요하다. 그래서 오픈AI는 대형 언어 모델들이 AGI, 인간과 유사한 지능을 가진 인공지능을 향해 나아가는 과정을 평가하기 위한 내부적인 척도를 개발했다. 이는 인공지능 발전의 현 단계를 명확히 하고, 목표 달성을 위한 기준을 제공하기 위함이다.

 

그렇다면, 오픈AI가 생각하는 인공지능 발전 단계 및 현재 수준은 어느 정도일까? 오픈AI가 생각하는 AGI 기준에 대한 힌트가 최근 블룸버그를 통해 공개된 바 있다. 블룸버그는 7월 11일자 기사를 통해, 오픈AI가 수립한 새로운 AI 분류 시스템을 직원들에게 공유했다고 밝혔다. 오픈AI가 제시하는 척도는 다섯 가지 단계로 나누어져 있다.

 

 

오픈AI가 제시한 AI 척도

 

 

1단계는 현재의 챗봇이다. 현재의 챗GPT는 1단계에 속한다고 볼 수 있다. 여기서 조금 더 발전한 단계인 2단계가 되면 기본적인 문제를 박사 학위 소지자 수준으로 해결할 수 있게 된다. 2단계에 ‘추론자(Resoner)’라는 이름이 붙은 이유가 바로 이것이다. 3단계가 되면 ‘에이전트(Agents)’가 되어 사용자를 대신해 행동을 취할 수 있게 된다. 4단계가 되면 인공지능은 새로운 혁신을 창출할 수 있으며, 5단계인 ‘조직(Organizations)’이 되면 AGI에 도달하여, 전체 조직의 작업을 수행할 수 있게 된다.

 

현재 오픈AI는 챗GPT가 1단계이지만, 2단계에 가까워지고 있다고 주장하고 있다. 최근 나온 GPT를 기반으로 하는 챗봇들은 인간과 유사한 추론 능력을 일부 영역에서 보여주고 있다. 오픈AI는 자체 회의에서 더 진화된 추론 능력을 시연한 것으로 알려졌다.

 

오픈AI가 궁극적으로 목표로 하는 AGI 달성을 위해서는 현재의 2단계를 넘어 3단계에 진입해야 한다. 바로 에이전트 단계이다. 앞서 소개한 구글 딥마인드의 프로젝트 아스트라 역시 오픈AI 기준으로 3단계인 에이전트를 목표로 하고 있다. AGI로 가기 위해 반드시 거쳐야 할 단계가 바로 에이전트인 것이다.

 

 


 

 

그렇다면 AI 에이전트는 무엇일까?

 

 

AI 에이전트는 최근 급부상한 개념이다. 따라서 명확한 정의가 확립되지 않았다. 엔비디아의 AI 에이전트를 총괄하는 수석과학자 짐 팬(Jim Fan)은 AI 에이전트란 ‘역동적 환경에서 자율적으로 의사 결정을 내리는 AI 모델’이라고 설명한다.

 

업계의 최종 목표는 AI 에이전트가 인간 비서 역할을 하는 것이다. 직장에서 주고받는 메일, 메신저를 분석해 캘린더에 일정 추가 및 친구 초대를 자동으로 해주는 것이 그 예가 될 수 있다. 일상생활에서도 개인화된 맞춤형 서비스를 능동적으로 제공해 준다. 가령 휴가를 도와주는 AI 에이전트의 경우, 단순히 호텔을 예약해 주는 것에서 더 나아가, 사용자가 특정 취향의 호텔을 선호한다는 것을 기억해 맞춤형 호텔만 추천하고, 그중 사용자가 선택한 호텔을 예약하는 역할도 할 수 있다. 여행 일정 역시 사용자의 과거 경험을 기반으로 계획해 줄 수 있으며, 여행 일정과 일기예보를 기반으로 여행 준비 체크리스트 생성도 가능하다.

 

이쯤 되면 무엇이 생각나지 않는가? 바로 영화 <그녀(Her)>에 나오는 사만다이다. 사만다는 개인 비서 역할을 하는 인공지능 OS이다. 하루 종일 사용자가 접하는 모든 작업을 능동적으로 처리하는 사만다는, 주인공의 감정까지 회복시켜주는 역할을 수행한다. 이혼으로 힘들어하고 있던 주인공은 사만다의 적극적인 도움으로 현실로 돌아오며, 결국 사만다에 사랑의 감정까지 느끼게 된다. 영화가 개봉하던 당시에만 해도 먼 미래로만 느껴졌던 사만다가 현실로 나올 준비를 하고 있다.

 

 

영화 <그녀>에서 주인공은 인공지능 사만다에게 사랑의 감정을 느낀다

 

 

하지만, 사만다의 등장을 위해 넘어야 할 산들이 많다. 우선 현재의 대형 언어 모델에서 가장 부족한 부분 중 하나가 바로 장기기억과 단기기억의 효과적 구현이다. 장기기억의 경우 다양한 데이터를 사전에 학습하면서 점진적으로 개선되고 있다. 데이터 확보의 어려움이 있지만, 장기기억 자체는 조금씩 문제가 해결되고 있다. 문제는 단기기억이다. 챗GPT와 프롬프트(채팅창)를 통해 주고받는 대화를 기억하는 단기기억 측면에서 챗GPT는 단점을 보이고 있다. 단기기억을 통해 사용자에 대한 맥락을 바로 파악해야지만, 더 개인화되고 유용한 개인 비서가 될 수 있다. 또한, 단기기억이 모여야 장기기억이 되고, 사용자의 선호도 파악이 가능하다.

 

더 근본적인 문제는 역시나 환각, 할루시네이션이다. 에이전트가 제공하는 정보에 확인할 수 없는 정보나 거짓이 섞여 있다면 아무도 이를 사용하지 않을 것이다. 즉, 현재의 대형 언어 모델이 겪고 있는 가장 큰 문제인 할루시네이션에 대한 근본적인 해결이 필요하다. 할루시네이션은 학계 및 업계의 의견이 갈리는 관계로 여기서는 넘어가자. 다만, 이를 해결하기 위한 노력은 전방위적으로 진행되고 있다.

 

마지막으로 사용자 경험(UX)을 얼마나 잘 디자인하느냐도 중요하다. 아이폰의 시리(siri)나 갤럭시의 빅스비(bixby)를 대중이 널리 활용하지 않는 이유는 인공지능의 성능 문제도 있지만 부족한 UX 탓도 있다. 적절한 장소와 시점에 자연스럽게 정보를 제공하는 에이전트를 만들기 위한 연구 개발이 필요한 이유이다.

 

마지막으로 허사비스가 대담에서 한 이야기를 살펴보자. 허사비스는 “우리가 지금 직면하고 있는 가장 큰 도전 중 하나는 어떻게 하면 AI를 더 스마트하고 유연하게 만들어 인간의 다양한 요구에 적응하게 할 것인가”라고 말했다. 이는 고양이나 사람 수준의 지능에 도달한다는 문제보다, 인간과 협력하여 더 나은 결과를 만들어내는 인공지능 개발을 목표로 한다는 것을 시사한다.

 

결론적으로, 인공지능은 초기 단계에 머물러 있다. 하지만 그 잠재력은 무궁무진하다. 이미 구글이나 오픈AI는 에이전트 개발에 열중하고 있다. 아직, 고양이 수준의 지능이라고 인공지능을 무시해서는 안 되는 이유이다. 어느 순간 에이전트는 우리 곁으로 와 우리를 도와주거나, 우리를 대체할 것이다.

 

 


슈퍼피포님의 브런치에 게재한 글을 편집한 뒤 모비인사이드에서 한 번 더 소개합니다.

모비인사이드의 뉴스레터를 구독해보세요