인간 지능 능가하는 '초인공지능' 등장
개발 강제하는 강력한 규제 마련 시급
생성형 인공지능의 선두 주자인 오픈AI는 샘 알트만(Sam Altman)과 일론 머스크(Elon Musk) 등이 2015년에 설립한 인공지능 연구 회사다. 머잖은 장래에 발생할지도 모르는 인간의 능력을 뛰어넘는 인공일반지능(AGI)의 존재 위험에 대한 염려와 공포가 설립의 주요한 동기 중의 하나라고 한다. 이 오픈AI가 세상에 널리 알려지게 된 계기는 2022년 11월 30일 날 챗GPT(Chat Generative Pre-trained Transformer)를 공표하고부터다.
오픈AI의 챗GPT 공표는 2006년 애플의 공동 창업주이자 21세기 혁신의 아이콘이라고 불리는 스티브 잡스(Steeve Jobs)가 스마트폰을 세상에 내놓은 이후 최대의 기술혁명으로 평가받아도 무방할 것 같다.
챗GPT는 인류 역사상 가장 빠른 속도로 확산하여 공개한 지 두 달 만에 1억 명의 사용자를 모은 새로운 서비스 매체다. 이전에 확산 속도가 가장 빨랐던 것은 인스타그램인데, 창업 2년이 지난 시점에 사용자가 3천만 명이었던 것에 비하면 엄청난 숫자다.
챗GPT는 1750억 개의 매개변수를 가지고 있으며, 이전의 생성형 AI와 구분 짓는 특징 중의 하나는 ‘인간의 피드백을 통한 강화학습(Reinforcement Learning from Human Feedback: RLHF)’을 했다는 것이다.
특히 GPT-4는 문자만이 아니라 이미지도 처리할 수 있는 멀티모달(Multi-Modal)이라는 점이다. 물론 성능도 3∽4개월 사이에 놀라울 정도로 향상되고 있다. 오픈AI는 GPT-4가 미국 변호사 시험(Uniform Bar Exam)에 상위 10퍼센트의 성적으로 통과했다고 밝히고 있다. 챗GPT도 시험에 통과하긴 했지만, 하위 10퍼센트에 속하는 성적이었다. 그뿐 아니라 GPT-4는 생물학 올림피아드에서 상위 1퍼센트에 들었으며, SAT 수학에서 800점 만점에 700점을 획득했고, MMLU에서 정답률 86.4퍼센트를 기록한 바 있다.
챗GPT에서 한국어로 질문할 때와 영어로 물을 때의 실력 차이에 비하여 GPT-4에서는 그 격차가 많이 줄었다. 그러나 GPT-4의 한국어 실력이 챗GPT의 영어 실력을 앞서 성능 면에서 많이 향상되었다. 규모 면에서 월등히 앞선 GPT-4가 이전에 하지 못했던 문제해결을 하기 시작했다. 그것이 곧 창발적 능력(Emergent ability)이다. 여기서 창발적 능력이란 느닷없이 나타나는 능력을 말하는데, 이것이 챗GPT에 비하여 훨씬 더 강해졌다는 의미이기도 하다.
챗GPT가 출현한 지 불과 3개월도 채 안 된 2023년 2월 24일 메타에서 거대언어모델(LLM)인 라마(Llama)를 오픈소스로 공개했다. 이 모델은 매개변수가 70억 개밖에 안 되지만, 챗GPT의 3000억 개보다 훨씬 많은 1조 4000억 개의 토큰으로 학습시켰다. 이처럼 매개변수가 적으면 연산할 때 훨씬 부담이 적어 연구용으로 적합하다고 한다.
곧이어 2023년 3월 13일 스탠퍼드대학 연구진이 라마에 기반을 둔 알파카(Alpaca)라는 모델을 내놓았는데, 이 모델 역시 GPT-3.5와 비슷한 성능을 보였지만 추가 학습(fine tuning)을 하는데 600달러도 들지 않은 저렴하면서 성능 좋은 모델이라고 선전한다.
챗GPT가 세상에 선보인 지 100일 남짓 지난 2023년 3월 14일 GPT-4가 출시되었다. 이는 챗GPT의 업그레이드된 버전이다. GPT-4의 구체적인 내용은 모두 비공개되었다. 즉, 모델 크기, 학습데이터, 매개변수의 숫자도 모두 비밀로 했다. 뒤이어 2024년 7월 23일 메타가 라마3.1을 공개했는데, 라마 3.1은 4050억 개의 매개변수를 가진 역대 최대 크기의 오픈소스 인공지능 모델이다.
이 모델은 오픈AI의 GPT-4o(omni), 앤스로픽의 클로드3.5 소네트(Sonnet)보다 성능이 뛰어나다고 한다. GPT-4는 매개변수가 1조 8000억 개쯤으로 알려져 있는데, 오픈소스 라마는 3분의 1보다 더 적은 크기로 비슷한 성능을 낸다는 것이다. 라마3.1은 멀티모달이 아닌데, 메타는 2024년 말에 멀티모달 모델을 공개할 예정이라고 밝히고 있다.
생성형 인공지능의 출현은 여기서 멈추지 않고 라마3.1이 발표된 며칠 뒤 프랑스의 미스트랄(Mistral)이 미스트랄 라지2((Mistral Large2) 모델을 공표했다. 미스트랄 라지2는 매개변수가 1230억 개로 메타의 라마3.1에 비해 3분의 1이 채 못 되는 크기지만, 성능은 라마3.1과 맞먹거나 때로는 우월하다는 평가를 받는다.
생성형 AI가 불과 3~4개월 만에 업그레이드되고, 글로벌 빅테크 기업이 앞다투어 성능이 우수한 버전을 개발할 수 있는 가장 주요한 이유 가운데 하나가 오픈소스의 영향이다. 그것은 메타가 라마를 공개한 뒤 수많은 모델이 나타나고 있는 것이 그 증거다. 그런데 글로벌 빅테크들은 명운을 걸고 치열하게 경쟁하고 있는 형국이다. 그래서 인간의 지능을 넘어서는 AGI가 어느 날 ‘짠’하고 나타나는 특이점이 온다고 해도 조금도 이상하지 않을 것 같다.
마이크로소프트가 발표한 ⌜AGI의 불꽃(Sparks of Artificial General Intelligence)⌟이라는 논문에서 GPT-4가 AGI의 시작이라고 보고 있다. 또한 제프리 힌턴(Geoffrey Hinton)의 주장에 따르면 이제 세상에는 동물의 뇌와 신경망이라는 두 가지 유형의 지능이 있다고 생각한다. 그것은 새롭고 더 나은 형태의 지능이다.
특히 이 새로운 인공지능이 선거나 전쟁 같은 가장 중대한 사태에 영향력을 행사할 수 있다는 점이 공포로 다가올 수 있다. 그러기에 우리는 새로운 기술에 대비하지 않으면 안 된다. 지금이야말로 인간의 능력을 능가하는 초인공지능의 개발을 강제하는 핵확산금지조약과 같은 강력한 법규제 마련이 시급하다 할 것이다.
*구병두((사)한국빅데이터협회 부회장/ 전 건국대학교 교육대학원 교수/(주)테크큐 대표이사)