드디어 오픈AI의 새로운 인공지능 버전, 코드명 ‘스트로베리’가 공개되었다. 이 모델은 복잡한 문제 해결 능력을 갖춘 대형 언어 모델로, 일부 ‘추론’ 기능이 가능한 것으로 알려져 있다. 답을 하기 전에 먼저 스스로 생각하고, 문제를 해결할 수 있는 능력을 갖춘 것이 특징으로, 이를 통해 높은 추론 능력을 보여주고 있다.
오픈AI는 9월 12일(현지시간) 새로운 모델 ‘오픈AI o1-프리뷰’와 ‘오픈AI o1-미니’를 공개했다. 챗GPT 유료 버전에 접속해 보면, 이 두 모델은 사용할 수 있도록 공개되어 있다. 프리뷰는 이름에서 알 수 있듯이, 추론에 특화되어 있지만 아직 ‘미리 보기’ 버전으로, 추후 지속적인 업데이트가 예고되어 있다. 미니는 프리뷰 기능 중 코딩 기능에 특화된 모델로, 개발자들은 무거운 프리뷰보다 미니를 사용하는 것이 좋다고 한다.
새로운 모델인 ‘o1-프리뷰’는 다양한 분야에서 뛰어난 성능을 보인다. 미국 수학 올림피아드(AIME) 예선에서는 미국 상위 500명 안에 드는 성적을 거두었으며, 물리학, 생물학, 화학 등 까다로운 문제를 해결하는 과제에서는 박사급 전문가보다 높은 정확도를 보였다. 코딩 능력을 겨루는 경진대회에서도 버전마다 차이는 있지만 대략 90% 이상의 경쟁자들보다 높은 성적을 거두었다.
오픈AI가 밝힌 성능 향상의 비결은 바로 ‘강화 학습’과 ‘생각의 사슬(Chain of Thought)’이다.
널리 알려진 바와 같이, 오픈AI의 모델들은 강화 학습을 통해 훈련한다. 강화 학습은 모델이 스스로 문제를 풀고, 그 결과에 따라 보상을 받아 가며 성능을 향상하는 기법으로, 이번 버전에서는 강화 학습을 더욱 ‘강화’했다고 밝히고 있다.
구체적으로, 이 모델은 단순 데이터를 학습하는 것이 아니라, 스스로 사고하고 결정하는 방식을 배운다. 모델이 문제를 해결할 때 여러 가지 접근 방식을 시도해 보고, 그중 가장 적합한 방식을 선택하여 반복 훈련을 하는 것이다. 강화 학습을 통한 훈련은 단순히 데이터를 더 투입하는 것이 아니라, 모델이 더 생산적으로 움직이도록 만든다. 훈련 시간에도 컴퓨팅 시간을 많이 할당하고, 사고에 필요한 테스트에도 컴퓨팅 시간을 많이 할당하면서, 문제를 푸는 능력을 강화할 수 있었다.
또 다른, 비결은 ‘생각의 사슬’이다. 이는 복잡한 문제를 풀 때 여러 단계에 걸쳐 사고하는 방식을 뜻한다. 사람이 어려운 문제를 풀 때 자연스럽게 머릿속에서 여러 단계를 거치듯, 이 모델 역시 문제를 단계별로 나누어 풀어나간다.
일상생활에서 우리가 풀어야 하는 문제는 복잡한 경우가 많다. 이를 한 번에 접근하지 않고, 작은 단위로 나누어 해결하는 것이 ‘생각의 사슬’의 핵심 개념이다. 이를 통해 문제 해결의 난이도를 낮출 수 있으며, 실수가 나오면 이를 바로 수정할 수 있다. 이는 모델이 단순히 한 번의 계산이나 추론에 그치는 것이 아니라, 여러 번의 사고 과정을 거쳐 점차 더 나은 해결책을 찾아가는 것을 의미한다.
추론에 강한 인공지능은 글쓰기에 약하다?
이번 오픈AI의 발표에서 또 하나 재밌는 점은 기존 GPT-4o와의 비교이다. 사람들을 대상으로 이번에 출시한 ‘o1-프리뷰’와 ‘GPT-4o’의 응답을 익명으로 제시한 후, 어느 응답을 선호하는지 투표를 진행했다. 그 결과, 추론이 중요한 데이터 분석, 코딩, 수학에서는 새롭게 출시한 프리뷰 버전의 응답이 크게 선호되었다. 하지만, 글쓰기나 수정과 같은 자연어 처리 작업에서는 기존 버전이 조금 더 선호된다는 사실을 확인할 수 있다. 이는 새로운 모델이 모든 용도에 적합하지 않음을 시사한다.
이번에 공개된 ‘o1’은 추론 분야에서 획기적 발전을 이뤘다. 프리뷰라는 이름에서 알 수 있듯이, 오픈AI는 지속해서 버전을 업데이트할 예정이다. 이전 글에서 구글 딥마인드의 추론 인공지능을 소개한 바와 같이, 인공지능이 추론을 하는 시대가 멀지 않은 것 같다. 추론을 하는 인공지능은 향후 다양한 전문 분야에서 새로운 활용 가능성을 열 전망이다. 이들의 새로운 인공지능 모델이 일상 업무를 어떻게 개선할 수 있을지 계속 지켜보는 것도 재밌을 것이다.
한글은 아주 재밌는 성질을 가지고 있다. 직관적인 언어 체계이지만, 비슷한 모양들로 구성되어 있어, 이를 변형한 소위 말하는 ‘야민정음’이 유행하기도 했다. 아래 예와 같이, ‘세종대왕’을 ‘새종머앟’이라고 한다든지, 내가 근무하는 ‘광운대학교’를 ‘팡운대학교’로 부르는 것이 그 한 예이다.
이번 오픈AI의 신 모델 발표에서 한글의 이러한 특성을 활용한 번역 사례가 등장했다. 한국인도 잘 이해하지 못하는 암호 문장을 챗GPT가 영어로 번역하는 모습을 공개한 것이다. 아래 유튜브 영상은 비교적 짧으니 한번 보는 것도 재미가 있을 것이다. 베스트 댓글도 아주 흥미롭다. 이제 구글 리뷰에 외국인이 못 알아보는 비밀 한글 리뷰는 남기지 못하게 되었다고.
(이를 부연 설명하자면, 구글 맵스를 통해 전 세계 음식점, 관광지 등에 한국 사람들이 리뷰를 남긴다. 안 좋은 리뷰를 남기면 현지 업주들이 번역기를 통해 이를 확인한 후 삭제하는 일들이 종종 있다. 이를 피하기 위해 한국인들은 우리만 알아볼 수 있는, 하지만 번역기는 번역하지 못하는 ‘야민정음’류의 글을 통해 리뷰를 남기곤 했다. 하지만 이제 이것도 번역이 되면서 이제 비판의 리뷰는 남기지 못하게 되었다.)
슈퍼피포님의 브런치에 게재한 글을 편집한 뒤 모비인사이드에서 한 번 더 소개합니다.