세계가 코로나 팬데믹을 겪으며 인류가 처한 여러 문제를 해결하는 과정에서 혁신적인 기술이 등장하고, 동시에 기술 간의 융합이 빠르게 이루어지며 창의적인 가치들이 창출되고 있다.
이에 초거대 AI에서부터 로봇, 스마트모빌리티, 웹3.0, 메타버스라는 인류의 행복과 평화를 책임질 최신 테크 트렌드를 5편의 시리즈로 소개할 예정이다. 특히 이 칼럼을 통해 얻는 ‘지식’도 중요하지만, 각 기술이 어떻게 연계되고, 어떤 방향으로 발전되고 있는지 ‘흐름’을 읽는 것도 큰 도움이 될 것이다. (필자 주)
2022년 11월 말에 세상에 등장한 챗GPT는 아이폰, 알파고의 등장에 버금가는 충격적인 사건이었다. 챗GPT의 등장으로 ‘초거대 AI’에 대한 관심이 폭증했고, 이로 인해 인류의 삶이 크게 변할 것이라는 전망이 펼쳐졌다. 초거대 AI는 대체 무엇이고, 현재 어느 수준까지 도달했을까? 이에 관해 살펴보고 앞으로의 찾아올 변화에 대해 알아본다.
초거대 AI는 인간의 뇌 구조를 닮은 딥러닝 기반 AI
초거대 AI(Super-Giant AI, Hyperscale AI)는 딥러닝 기법을 쓰는 인공신경망 가운데서도 파라미터(Parameter, 매개변수)가 무수히 많아 스스로 학습·사고·판단할 수 있는 인간의 뇌 구조를 모방한 AI를 의미한다.
초거대 AI란 위 개념을 바탕으로 국내 한 AI 연구원이 만든 용어로, 아직 파라미터의 개수나 사고의 깊이 등 명확한 기준이 규정되지는 않은 상태다. 다만 통상적으로 대용량 연산이 가능한 컴퓨팅 인프라, 딥러닝을 기반으로 대규모 데이터를 스스로 학습하고 사고하며 판단할 수 있는 AI를 가리켜 ‘초거대 AI’라고 부르고 있다.
▲ 인공지능에 쓰이는 머신러닝과 딥러닝의 차이
일반적으로 인공지능은 머신러닝(Machine Learning, 기계학습)과 딥러닝(Deep Learning)으로 구분된다. 머신러닝은 누적된 경험을 통해 컴퓨터가 스스로 학습할 수 있게 하는 알고리즘이다. 처리해야 할 정보를 더 많이 학습하기 위해서는 보통 많은 양의 데이터가 필요하다.
딥러닝은 머신러닝의 개념 중 하나인 인공신경망(Artificial Neural Network, ANN)에서 발전한 형태다. 인공신경망은 뇌의 뉴런과 유사한 정보 입출력 계층을 활용한 것으로, 블랙박스 형태로 데이터를 입력하면 자동으로 복잡한 수학식 모델링이 이뤄지는 기법이다. 네이버의 번역 서비스 ‘파파고’나 구글의 번역 프로그램이 대표적인 예다. 딥러닝은 이러한 인공신경망을 사용한 알고리즘을 통해 데이터를 학습한다. 이 딥러닝 영역에 속하는 것이 초거대 AI다.
딥러닝은 추상적인 정보를 인식하는 능력이 뛰어나다. 머신러닝은 컴퓨터에 입력할 소재를 인간이 먼저 처리해 줘야 했다. 사진 정보 학습을 예로 들면 사람이 먼저 트레이닝 데이터를 분류해 입력하면, 컴퓨터가 데이터에 포함된 특징을 축적·분석해 답을 도출해 내도록 하는 방식이었다. 하지만 딥러닝은 이런 번거로운 작업이 생략된다. 딥러닝 알고리즘이 스스로 분석하고 답을 내기 때문이다.
딥러닝의 이러한 추론 능력 때문에 초거대 AI가 기존 데이터들을 학습해 글을 쓰고 그림을 그리고 음악을 만드는 일이 가능한 것이다. 인간이 어떤 창작 혹은 예술 작업을 할 때, 먼저 이전에 나온 수많은 작품들을 보고 듣고 참고해서 결과물을 만들어 내는 것과 유사한 원리다.
초거대 AI는 대용량 데이터를 학습해 기존 AI보다 더 인간의 뇌에 가깝게 학습 및 판단 능력이 향상된 형태다. 알파고는 바둑 분야에 특화돼 있지만 초거대 AI는 여러 상황에 대해 스스로 학습해 역할을 수행한다. 이를 위해 기존 AI보다 수백 배 이상의 데이터 학습량이 필요하다.
초거대 AI는 어떻게 초대량의 데이터를 학습해 인간의 뇌처럼 스스로 생각할 수 있는 걸까? 답은 인간 뇌의 뉴런 간 정보전달 통로인 시냅스와 유사한 역할을 하는 ‘파라미터’에 달렸다.
초거대 AI의 능력을 결정짓는 파라미터
▲ 초거대 AI에 쓰이는 인공신경망의 원리
인간의 뇌는 1,000억 개 이상의 뉴런(신경 세포)으로 구성되어 있다. 뉴런은 외부로부터의 자극(여러 입력값들)을 받으면 이를 가중해 합산하고 그 값이 임계값을 넘으면 다음 뉴런에 신호를 전달한다. 각 뉴런들은 100조 개 이상의 시냅스로 연결되어 서로 전기, 화학적 신호를 주고받으면서 정보를 처리한다. 인공 신경은 사람의 뉴런을 모방해 여러 가지 입력값에 가중치를 두고 이를 합친 뒤 그 값이 임계값을 넘어서면 출력한다. 이 인공 신경을 네트워크로 연결한 것이 인공 신경망이다.
초거대 AI는 시냅스와 비슷한 역할을 하는 인공 신경망의 파라미터에 의해 작동한다. 인간의 시냅스는 기억을 담당하고 있는데, 뉴런과의 상호작용으로 기억, 학습, 인지 기능이 나타나게 된다. 평균적으로 인간의 뇌는 100조 개의 시냅스를 가지고 있다. 딥러닝으로 AI를 학습시킨다는 것은 가중치, 즉 파라미터를 찾는 것이다.
예를 들어 고양이를 판별할 때 고양이가 갖고 있는 여러 요인에 어떻게 가중치를 부여해야 가장 정확하게 판단할 수 있을지를 계산해 내는 것이다. 고양이를 정확하게 분류하는 딥러닝 모델을 만들려면 품질이 높은 고양이 이미지와 고양이를 분류하는 요인들이 다양해야 한다. 쉽게 말해 눈과 코의 모양만으로 분류하는 것보다 눈, 코, 입, 귀, 꼬리 등 많은 변수를 고려하는 것이 더 정확하다.
초거대 AI는 파라미터가 많을수록 더 정교한 학습을 할 수 있다. 결국 AI의 기술 발전은 파라미터 수를 얼마나 높일 수 있느냐에 달렸다 해도 과언이 아닐 것이다. 그렇다면 현재 초거대 AI는 어디까지 발전했고 무엇을 할 수 있을까? 이제부터 알아보자.
인류의 난제를 해결하는 초거대 AI
초거대 AI는 인류가 오랫동안 풀지 못한 난제 해결에도 기여할 수 있을 것으로 기대를 모으고 있다. 구글 딥마인드가 개발한 초거대 AI ‘알파폴드2(AlphaFold2)’는 단백질 접힘* 구조를 분석해 많은 이목을 끌었다.
* 단백질 접힘(Protein Folding) : 단백질은 체내에서 고유의 기능을 수행하기 위해 1차원 서열에서 3차원 구조를 형성한다. 단백질을 구성하는 아미노산이 구부러지면서 3차원 입체 구조가 형성되며, 이때 단백질의 특징과 기능이 결정된다. 단백질 접힘 구조를 알 수 있다면 단백질의 역할을 이해하고, 잘못 접힌 단백질로 인해 발생하는 질병의 진단 및 치료에 활용할 수 있다.
지금까지는 과학자들이 X선, 핵자기공명(Nuclear Magnetic Resonance, NMR), 저온전자현미경(Cryo-EM)을 이용하여 단백질 구조들을 밝혀내 단백질 데이터 은행(Protein Data Bank, PDB)을 구축했다. 다만 수개월~수년의 시간이 걸리고 많은 비용이 들어 수억 개의 단백질 중 겨우 18만 개가 넘는 단백질 구조만을 저장할 수 있었다.
▲ 이전 버전의 성과를 크게 뛰어넘은 알파폴드2의 단백질 구조 예측 점수
그런데 단백질 구조 예측 대회(CASP)*에서 알파폴드2는 기존에 30~40점대 수준이었던 단백질 접힘 예측 점수를 90점 수준까지 끌어올렸다. 구조 예측에 걸리는 시간도 수 분에서 수 시간으로 단축했다. 알파폴드2는 단백질 서열이나 구조 중에서도 더 중요한 역할을 하는 곳에 ‘집중’해서 정보를 가져와 정보 처리에 드는 시간을 대폭 단축했다. 알파폴드2의 놀랄만한 성능 덕분에 예측할 수 있는 단백질 수는 획기적으로 증가해 2022년 7월 기준으로 지구상에 알려진 거의 모든 단백질(약 2억 개)의 구조를 예측할 수 있게 되었다.
* 단백질 구조 예측 대회(CASP, Critical Assessment of protein Structure Prediction) : 단백질 구조 예측 알고리즘의 성능을 평가하기 위한 경쟁으로, 미국 국립보건원(NIH)이 후원하는 국제 대회다. 1994년 시작돼 2년마다 개최된다.
이처럼 알파폴드2라는 초거대 AI 덕에 인류는 생명 현상의 메커니즘을 밝혀낼 실마리를 얻었다. 알파폴드2의 성과로 신약 개발 분야에서도 기존에 고치지 못한 질병 치료에 진보가 있을 것으로 기대하고 있다. 미래에 더욱 발전할 초거대 AI로 인류는 질병을 극복하고 더 건강한 생활을 영위할 수 있을 것으로 예측된다.
사람에 가까운 AI 챗봇, 챗GPT의 등장
2022년 11월 말, 챗GPT의 등장은 전 세계에 충격을 안겼다. 챗GPT는 오픈AI가 개발한 GPT-3.5 버전에 해당하는 대화형 AI 서비스로, 이용자와 실시간으로 대화가 가능하다. 이전 버전인 GPT-3의 방대한 데이터 처리 능력을 바탕으로, 기존의 AI 챗봇과 달리 훨씬 자연스러운 대화가 가능해져 많은 이를 놀라게 했다.
챗GPT는 온라인에서 가져온 방대한 양의 텍스트 샘플을 학습하고, 대화형 인터페이스를 통해 정보를 제공한다. 대화를 나누던 도중 맥락에 맞지 않거나, 어색한 회피성 답변을 보이던 기존 챗봇과는 달리, 챗GPT는 실제 인간과 구분할 수 없을 만큼 자연스러운 대화가 가능하다. 간단한 질문뿐만 아니라 어려운 내용을 요약해달라고 요청할 수도 있다. 더 놀라운 점은 스스로 내놓은 답변에 대한 실수를 인정할 뿐만 아니라, 잘못된 전제에 이의를 제기하고 부적절한 요청에 대해서는 답변을 거절한다는 점이다. 예를 들어 차를 훔치는 방법에 대해 물을 경우 “차를 훔치는 것은 심각한 범죄”라고 말하며 답변하지 않는다. 또한 대부분의 AI 챗봇이 이전 대화를 기억하지 않는 반면, 챗GPT는 사용자와 이전에 나눴던 대화를 기억하고 대화에 반영한다.
전문가들이 챗GPT에 흥분하는 이유는 짧은 논문이나 에세이, 노래, 시 등을 작성할 수 있고, 심지어는 코딩 도구로도 활용할 수 있기 때문이다. 또한 한국어로 질문이 가능하고 답변도 한국어로 받을 수 있다. 기존의 AI 챗봇과 대화할 때는 AI가 좀 더 이해하기 쉬운 단어나 문장 등을 고민하며 작성했는데 챗GPT에서는 그런 걱정 없이 정말로 사람과 대화하듯 질문할 수 있게 된 것이다.
직접 사용해 본 결과 초거대 AI에 대한 질문에 개념을 잘 설명해 주었고, 스트레스 해소법을 알려주거나 비 오는 날 들을 만한 음악 추천도 해주었다. 답변을 보면 알겠지만 내용 자체가 엄청 대단하거나 놀랄만한 것은 아니다. 하지만 돌아오는 답변의 자연스러움이 기존의 AI 챗봇과 전혀 달랐다. 게다가 준비된 답변이 아닌 질문을 이해해서 답변을 ‘만들어 내는’, 즉 ‘생성(Generative)’해 낸다는 점이 앞으로의 발전에 기대감을 주는 부분이다.
▲ 챗GPT에게 질문해서 얻은 결과
챗GPT 출시 4개월 만에 깜짝 등장한 GPT-4
세상을 놀라게 한 챗GPT가 출시된 지 4개월 정도 지난 2023년 3월 14일, ‘GPT-4’가 출시됐다. 2023년 상반기 이후에나 출시될 것이라는 예상을 깨고 엄청나게 빠른 속도로 등장한 것이다. GPT-4는 유료 버전인 ‘챗GPT PLUS’에서만 사용 가능하지만, 마이크로소프트의 검색엔진 ‘뉴 빙(New Bing)’에도 탑재되어 꼭 유료 버전을 구입하지 않아도 GPT-4를 체험해 볼 수 있다.
GPT-4는 한 번에 기억할 수 있는 단어 수가 크게 늘었다. 이전 버전인 챗GPT는 최대 약 8,000개의 단어를 입력할 수 있었고, 이는 책 4~5페이지에 해당하는 분량이다. 반면 GPT-4는 약 6만 4,000개의 단어를 입력할 수 있는데, 약 50페이지에 달하는 분량으로 웬만한 단편 소설 한 편과 맞먹는다. 수십 페이지에 달하는 문서도 한 번에 입력해 요약해 달라고 하면 순식간에 요약 정리 해준다.
언어 구사 능력도 향상되었다. 한국어를 포함한 26개 언어에서 70% 이상의 정확도로 이해력이 크게 향상됐다. GPT-4의 처리 가능 영어 단어는 2만 5,000개로 챗GPT의 약 8배로 늘어났다. GPT-4는 말투나 스타일도 변경할 수 있는데, 사용자가 GPT-4에게 해적 스타일로 말해달라고 요청하면 해적의 말투로 답변을 내놓는 식이다.
독창성과 창의성도 강화되었는데, 동화 신데렐라의 줄거리를 A~Z 순으로 각 알파벳을 사용하되 중복되는 단어 없이 요약해달라는 요청에도 완벽하게 요구 사항을 수행해 냈다. 이런 글짓기는 인간도 해내기가 쉽지 않은데 GPT-4는 단시간에 해낸 것이다. 참고로 같은 질문을 구글의 AI 서비스 ‘바드(BARD)’에게 하면 글짓기는 고사하고 질문을 무시한 답변만 나온다.
▲ GPT-4에게 신데렐라의 줄거리 요약을 요청한 결과 / 오픈AI의 자료를 재가공
이미지를 해석할 수 있는 멀티모달 GPT-4
GPT-4의 지능 역시 높아졌다. 특히 전문적인 시험에서 ‘인간 수준의 능력’을 보여줬는데, 미국 모의 변호사 시험에서는 90번째, 대학 입학 자격시험인 SAT 읽기와 수학 시험에서는 각각 93번째와 89번째의 백분위수를 기록했다. 이는 상위 10%에 해당하는 수준으로, 기존 챗GPT는 하위 10% 정도의 점수대를 나타냈다. 하지만 GPT-4에서도 수학 문제 해결 능력은 크게 개선되지 않았다.
GPT-4는 기존 챗GPT에 비해 사실을 기반으로 대답하는 응답 비율이 40% 정도 높아졌다. 인터넷 밈(Meme: 유행하는 콘텐츠)으로도 유명했던 ‘세종대왕 맥북 던짐 사건’*에 대해 GPT-4에게 질문하면 “이 질문은 농담으로 보입니다”라고 답해 어느 정도 허구와 사실을 구별해 답을 내놓을 수 있게 됐다. 하지만 여전히 사회적 편견이나 허구, 적대적 표현과 관련한 문제를 나타낼 수 있기 때문에 GPT-4에서도 ‘할루시네이션(Hallucination: 환각, 거짓 답변 현상)’은 경계할 필요가 있다. 한편, GPT-4의 정보 역시 아직은 기존 챗GPT와 동일하게 2021년 9월까지의 정보를 제공한다.
* 세종대왕 맥북 던짐 사건: 한 네티즌이 챗GPT에게 ‘세종대왕 맥북프로 던짐 사건’에 대해 알려달라 물었고, 이에 챗GPT가 마치 실제 있었던 역사처럼 ‘세종대왕이 한글을 창제하던 중 맥북을 던졌다’고 응답해 인터넷에서 화제가 되었다.
GPT-4에서 가장 눈에 띄는 변화는 텍스트와 이미지를 이해할 수 있는 멀티모달 모델(Multi-Modal: 텍스트, 사진, 음성, 동영상 등 여러 복합 정보를 이해할 수 있는 AI 모델)을 채택했다는 점이다.
텍스트만 인식할 수 있었던 기존 챗GPT와 비교해 사진이나 그림을 인식하는 것은 물론 이미지 속 ‘맥락(Context)’을 이해할 수도 있다. 예를 들어 밀가루와 달걀 사진을 GPT-4에 입력한 뒤 “이 재료로 무슨 음식을 만들 수 있어?”라고 물으면, GPT-4는 “팬케익이나 와플 등 여러 가지 음식을 만드는 것이 가능하다”고 답한다. 또 많은 풍선이 달려있는 그림을 보여주며 “줄을 자르면 어떻게 될까?”라고 물어보면 “하늘로 날아갈 것”이라고 답해 그림 속 상황을 정확히 이해할 뿐만 아니라, 공기보다 가벼운 물체는 떠오른다는 개념까지 포함해 답변했다는 점을 알 수 있다. ‘다람쥐가 카메라를 들고 호두를 찍는 사진’을 GPT-4에게 보여주며 ‘이 그림의 어디가 웃기지?’라고 물으면 GPT-4는 “다람쥐는 호두를 먹지 사진을 찍지 않는데 마치 다람쥐가 사진사처럼 사람 흉내를 내는 부분이 재밌다”라고 유머 섞인 답변도 내놓는다.
‘알잘딱깔센’ 초거대 AI 비서의 등장이 멀지 않았다
앞서 보았듯이 초거대 AI에서 가장 주목할 특징은 바로 ‘생성’, 스스로 컨텐츠를 만들어 낸다는 점이다. 이용자가 AI에게 어떤 것을 만들어 달라고 요구하면, 그 요구에 맞춰서 결과를 만들어 내는 AI를 ‘생성형 AI(Generative AI)’라고 한다.
이는 AI에게 특정 개념을 학습시키는 것이 아니라 데이터 원본을 제공하고 나머지 부분을 예측하도록 유도해 그 과정에서 AI가 추상적인 표현을 배울 수 있도록 하는 모델이다. 주어진 학습 데이터와 유사한 분포를 따르는 데이터를 생성하는 모델이기 때문에, 원본과 유사하지만 완전히 똑같지는 않은, 실존하지는 않지만 있을 법한 새로운 이미지, 비디오, 오디오, 텍스트 또는 코드 등의 창작물을 연속적으로 만들 수 있다.
눈에 띄는 발전을 이룬 것은 이미지 생성 AI다. 실제로 현재 ‘미드저니’, ‘달리 2(DALL-E 2)’, ‘크레용(Craiyon)’ 등 그림을 그려주는 초거대 AI 프로그램으로 누구나 텍스트를 입력하기만 하면 손쉽게 그림을 그릴 수 있는 시대가 되었다.
▲ ‘모네 스타일로 파리에서 비가 오는 날 커피를 마시며 책 읽는 노인’을 그려달라고 미드저니에게 요청해 얻은 그림
‘Generative’, ‘생성’이 갖는 의미는 일일이 AI에게 지시하거나 학습시키지 않아도 알아서 이용자가 요구하는 바를 만드는, ‘이것저것 다 할 수 있는 AI’의 등장할 수 있다는 것이다. 다시 말해 영화 아이언맨에 등장하는 AI 비서 ‘자비스’와 같이 ‘알잘딱깔센(알아서 잘 딱 깔끔하고 센스있게)’ AI가 우리 일상 곳곳에 도입되어 생활을 더욱 편리하게 해줄 수 있다는 얘기다.
2016년 알파고가 등장해 ‘AI가 사람과의 대결에서 이길 수 있다’라는 충격을 줬다면, 챗GPT는 ‘AI가 사람처럼 쓰고 말하고 행동할 수 있다’는 더 큰 충격을 안겨주었다. ‘GPT-4’ 등장과 함께 빅테크들을 비롯한 글로벌 기업들은 초거대 AI에 주목하기 시작했고, 본격적인 경쟁이 시작되었다.
이제 초거대 AI의 남은 과제는 사람들의 신뢰를 얻는 일이다. 가까운 미래의 초거대 AI가 이 문제까지 극복할 수 있다면 인류는 지금껏 경험하지 못한 새로운 AI 세상을 맞이하게 될 것이다.
※ 본 칼럼은 반도체에 관한 인사이트를 제공하는 외부 전문가 칼럼으로, SK하이닉스의 공식 입장과는 다를 수 있습니다.