세상에 스마트폰이 등장했을 때처럼 놀라운 혁신이 등장했다. 챗GPT(Chat Generated Pre-trained Transformer)의 이야기다. 최근 언론을 비롯해 다양한 플랫폼에서 연일 언급되고 있는 챗GPT는 인류의 미래를 변화시킬 핵심 기술이라는 평가를 받고 있다.
뉴스룸은 다양한 분야에 창작 활동을 챗GPT에 입력하고, 그 결과물에 대한 평가를 전문가들에게 들어보는 시간을 가졌다. 지금부터 챗GPT가 만든 시(문학), 시놉시스(영상), 코딩(파이썬)의 사례와 전문가들의 의견을 들어보자.
먼저 챗GPT는 과연 어떻게 시를 쓸까? 사람들이 써놓은 시를 학습해 비슷한 형태의 흉내를 내는 수준이었을까? 챗GPT를 활용해 시를 쓰고, 그 수준이 어느 정도인지 확인해 보기 위해 김종훈 고려대학교 국어국문학과 교수에게 평가를 요청했다.
Q. 챗GPT가 쓴 시에 대한 전반적인 평가 부탁드립니다.
A. 시를 평가할 때는 다양한 기준이 있지만, 쉽게 이해할 수 있도록 간단한 기준을 정해서 평가를 해봤는데요. 첫 번째로는 이 표현을 독자들도 쉽게 쓸 수 있는 표현이냐, 아니냐를 고려해봤고, 두 번째로는 해당 표현의 필연성이 있는가를 기준으로 평가했습니다.
결론부터 말씀드리면, 기대 이상이었다고 할 수 있을 것 같아요. 저 역시도 시를 보고 ‘괜찮은 표현이다’ ‘일상적이지 않은 표현이다’ 생각이 들었던 부분이 많이 있었거든요. 물론, 우리가 일상에서 사용하는 익숙한 표현, 혹은 특정 낱말을 설명하기 위한 산문적인 요소들이 있어서 아쉬움이 있었지만 그래도 이 정도의 시를 만들었다는 것은 아주 놀라운 일이라고 생각합니다.
Q. 챗GPT에 만들어 달라고 한 시, ‘목련의 이름’을 조금 더 자세히 평가해 주시겠어요?
A. 전체적으로 읽어보고 한 구절, 한 구절 읽어봤는데요. 시의 전체 형태를 봤을 땐, 제법 그 형태를 잘 만드는 것 같았습니다. 특히 입력값인 ‘목련의 이름’과 ‘생일’이라는 주제를 표현하기 위해 상당히 노력했다는 느낌도 들었고요.
한 구절씩 살펴보면 특정 표현은 정말 좋다고 느꼈는데요. 첫 문단에서 ‘힘의 상징, 빛의 광선’ ‘5월 어느 날 태어난 갱신의 시간’과 같은 표현으로 목련(매그놀리아)을 설명하는 것은 상당히 놀라운 부분이었습니다.
특히 두 번째 문단에서 ‘은혜로 충만한 삶의 빛나는 본보기’라는 구절은 이걸 읽고 어떤 삶이 은혜로 충만할 것이며, 어떤 본보기가 될 것인지, 그리고 이 표현에 담긴 의미가 무엇인지를 고민하게 만들기도 했습니다. 이는 독자들에게 아주 중요한 요소인데요. 해당 구절 다음에 오는 표현들은 어떤 표현인지, 무엇을 이야기하고자 하는 지를 상상하고 그려볼 수 있기 때문입니다. 비슷한 맥락으로 마지막 문단과 행의 ‘영원히 선포되는 은혜의 상징’도 상당히 인상적인 표현이라고 생각이 드네요.
물론 지나치게 주제를 설명하려고 한다거나 우리가 일상에서 사용하는 표현들이어서 조금 아쉬운 부분이 있기는 했습니다만, 전반적으로 이해가 안 되는 난해한 표현이나 의미 전달이 되지 않는 형태의 시가 나오지 않은 것만으로도 상당히 유의미한 결과물이지 않나 생각합니다.
Q. 마지막으로, 챗GPT와 같은 인공지능이 시와 같은 문학계에 끼칠 영향에 대해 어떻게 전망하시나요?
A. 저는 개인적으로는 인공지능이 우리의 시를 좀 더 높은 수준으로 끌어올릴 수 있다고 생각하고 있습니다. 인공지능이 발전하면서 문학계에서도 인공지능을 활용하고자 하는 움직임이 더욱 많아지고 있는데요. 실제로도 인공지능이 쓴 시를 모아놓은 시집이 발간되기도 했으며, 인공지능과 시인들이 함께 만든 시를 엮은 시집도 등장한 상황입니다.
인공지능의 발전 속도가 워낙 빨라서 조금 놀랍기는 하지만, 인공지능은 우리가 사용하는 일상 너머의 언어를 표현하는 데 뛰어난 능력이 있는 것 같다는 것입니다. 사람들은 보통 우리가 평소 사용하는 언어의 영역, 그 외연을 뛰어넘기 어려워하거든요. 이는 일상 지각 밖에서 표현을 찾아내는 일이니까요. 하지만 인공지능은 각각의 낱말이 갖는 의미와 낱말의 사용 사례 등을 통해 우리가 생각하지 못한 다양한 표현을 만들어내는 능력이 뛰어나다고 느꼈습니다.
이제 시인들도 이런 인공지능의 능력을 활용해보면 좋지 않을까 생각합니다. 인공지능을 통해 새로운 창의력의 모티브를 얻고 시인들은 이러한 모티브를 잘 다듬어서 본인의 창의력을 더욱 발산하는 것이죠. 또한, 인공지능으로 인해 시인들이 위협을 받게 될 것이라는 지적에 대해 저는 오히려 이러한 위협이 시인들에게 좋은 자극이 될 것으로 생각합니다. 시인들은 이제 시를 쓰면서 더욱 많이 고민하겠죠. ‘인공지능도 쓸 수 있는 수준의 시를 쓸 순 없다’라며 기존에 쓰던 시보다 더욱 훌륭한 시를 쓰지 않을까요?
그리고 이렇게 만들어진 훌륭한 시들이 다시 또, 인공지능의 학습 데이터로 들어가게 되고, 인공지능의 수준이 높아지면, 시인들은 또, 이것을 모티브로 더 훌륭한 시를 만들어 낼 수 있다고 생각합니다.
두 번째는 전체적인 줄거리를 표현하는 영화 시놉시스를 챗GPT는 과연 어떻게 썼을까? 우리는 최근 메모리 반도체 시장을 주제로 챗GPT에 제작해달라 요청했고, 그 결과물을 영화 제작 전문 업체 ‘스튜디오 N’의 손기선 프로듀서에게 요청했다.
▲ 챗GPT가 만든 시놉시스로 만들어 본 이미지 콘티
Q. 챗GPT가 만든 시놉시스, 어떻게 보셨나요?
A. 먼저 저는 이러한 인공지능이 쓴 시놉시스가 평가할 수 있을 정도로 작성됐다는 것 자체가 놀라운데요. 보통 어떠한 이야기의 시작을 살펴보면 인물이 특정 상황에서 어떤 선택을 해야 하는지 고민하는 데서 시작되는 경우가 많거든요. 작가는 인물이 겪을 만한 갈등을 고민하고 이를 이야기로 구성하는 것이죠. 이것은 지금까지는 오직 인간만 가능한 영역이었습니다.
물론 현재 이 결과물로 어떠한 콘텐츠를 만들기에는 아직 부족해 보입니다. 기승전결을 갖추긴 했지만, 캐릭터의 성격이나 사건의 이야기가 쉽게 납득할 수 있는 수준이 아니거든요.
하지만, 챗GPT가 쓴 시놉시스를 보니 머지않아 더욱 발전할 인공지능이 이러한 인간의 영역을 침범할 수도 있겠다는 생각이 들었어요. 좀 더 자세히 설명해 드리자면, 납득하기 어려운 수준이긴 했지만, 챗GPT가 쓴 시놉시스에도 인물의 갈등과 고민, 선택이 존재했으며 이로 인해 사건이 변화하는 등 이야기 자체는 구성이 됐다는 점이 상당히 놀라웠습니다.
Q. 그렇다면, 시놉시스 영역을 챗GPT가 완전히 대체할 수 있을까요?
A. 현재 상황에서는 어려울 수 있습니다. 다만, 지금까지의 발전 속도를 생각해보면 머지않아 정말 사람이 쓴 시놉시스보다 뛰어난 시놉시스가 만들어질 가능성도 있다고 생각합니다.
그리고 인공지능이 쓴 시놉시스의 수준이 빠르게 향상된다면 콘텐츠 업계에서도 굳이 이것을 쓰지 않을 이유는 없다고 생각해요. 결국 더 이상 사람이 시놉시스를 쓰지 않는 날도 올 수 있겠죠. 다만, 살펴봐야 할 것은 챗GPT의 동작 구조입니다. 아무리 챗GPT가 수준 높은 글을 쓰게 되더라도 아무런 주제도, 아무런 키워드도 입력되지 않은 상황에서 시놉시스를 창작하지 않아요. 결국 어떤 키워드를 입력하느냐가 중요해질 것입니다. 결국, 원하는 방향성을 갖춘 시놉시스를 만들도록 하는 일종의 ‘연출’이 사람의 영역이 될 것으로 생각합니다.
언젠가는 챗GPT가 콘텐츠 업계에 혁신을 가져오겠지만, 이런 혁신의 상황에서도 사람들은 어떤 연출을 할 수 있는가, 챗GPT를 얼마나 잘 활용할 수 있는가로 평가받고, 그에 따른 역할을 하게 되지 않을까요?
마지막으로 코딩(Coding) 능력을 확인해봤다. 챗GPT의 코드 생성 능력은 빠르고 정확하다는 평가가 있었던 만큼, 실제로 어느 수준인지 확인하기 위해 SK하이닉스 장비/품질분석시스템 김지원 TL에게 챗GPT를 활용한 코딩의 결과물에 대한 평가를 요청했다.
Q. 챗GPT에 간단한 코딩부터 다소 복잡한 코딩까지 입력하셨는데요. 전반적인 평가를 부탁드립니다.
A. 상당히 놀라운 결과를 얻을 수 있었습니다. 천지가 개벽한다는 표현이라면 적절할 것 같은데요. 현재 챗GPT의 코딩 능력을 보고 있자니, 언젠가는 사람이 직접 프로그램을 만들지 않아도 될 날이 올 수도 있겠구나 싶네요. 해외의 한 스타트업 CEO가 언급한 ‘프로그래밍의 종말(The End of Programming)’이라는 표현이 정말 공감되는 수준이었습니다.
특히 저는 ‘자연어 입력 → 프로그램 코드’로 연결되는 진정한 의미의 노코드 툴(No-code Tool)*이 챗GPT를 통해 탄생한 것이 아닐까 싶을 정도로 감탄했습니다. 단순히 코드만 생성해주는 것이 아니라 코드에 대한 설명과 결괏값 예시까지 보여주기 때문에 더욱 놀라운 수준인 것이죠. 저는 프로그래밍은 결국 개발자가 원하는 결과를 얻기 위해 컴퓨터와 대화하는 과정이라고 생각하는데요. 컴퓨터와의 대화 수단으로 사용돼 왔던 것이 과거 ‘0101…’로 만들어지는 이진법으로 시작해 C언어, 파이썬과 같은 프로그래밍 언어를 넘어, 이제는 ‘자연어’가 활용되고 있는 것처럼 느껴졌습니다.
* 노코드 툴(No-code Tool) : 코딩을 모르는 비(非) 개발자, 일반인도 간단히 개발을 할 수 있게 도와주는 도구. 코딩을 최소화, 간소화해 일반인도 개발자와 유사한 수준의 개발이 가능하게 만들어준다.
Q. 현재 챗GPT의 코딩 능력은 어느 정도 수준인가요?
A. 위에서 보여드린 것처럼 간단한 입출력을 갖는 기능의 프로그램이나 널리 알려진 알고리즘 정도는 지금의 챗GPT로도 충분히 처리가 가능한 수준입니다. 챗GPT의 코딩 능력을 더 자세히 살펴보기 위해 유명 코딩 문제은행에서 구분하는 0~5단계의 난이도 별 문제들을 활용해 테스트해보니 현재 챗GPT의 코딩 수준은 2단계(한글 입력 기준) 정도인데요. 실제 IT 기업들이 개발자를 뽑을 때 진행하는 코딩 면접의 문제가 1~4단계 수준인 것을 감안하면 단 몇 초 만에 2단계 수준의 결과물을 만드는 것은 상당한 수준이죠. 더 놀라운 점은 챗GPT가 생성할 수 있는 프로그래밍 언어가 수십 개 이상*이라는 점입니다. 효율성 측면에서는 그야말로 압도적이라고 볼 수 있을 것 같습니다.
* 챗GPT로 생성할 수 있는 프로그래밍 언어 리스트 : C, Python, JAVA, JavaScript, PHP, Ruby, Swift, Kotlin, Rust, Go, Perl, Lua, TypeScript, Scala, Dart, Julia, Shell script, R, MATLAB, SAS, Visual Basic, COBOL, FORTRAN, Lisp, Prolog 등
특히 프로그래밍을 하다 보면 요구사항이 변경되기도 하고, 예외 처리를 추가해야 하거나 성능을 개선해야 하는 등 다양한 변화가 반복적으로 필요한데요. 이러한 변화를 시도하는 과정에서도 챗GPT는 과거에 입력했던 내용들을 잊지 않고 새롭게 생성하는 코드에도 적용해 주는 것이 정말 인상적이었습니다.
Q. 챗GPT에서 다소 아쉬웠던 점이나 개선이 필요한 점은 무엇이 있었나요?
A. 현재 챗GPT를 포함한 생성형 인공지능(Generative AI) 기반의 모든 대규모 언어 모델에는 몇 가지 해결해야 할 문제가 있는데요. 그중 가장 큰 문제는 ‘할루시네이션*’ 에러가 발생한다는 것입니다. 이러한 할루시네이션 현상은 인공지능 모델이 내는 결과가 확률(0~100%)에 기반하기 때문인데요. 사실관계의 확인보다는 다음에 오는 결과의 확률이 얼마나 높은가를 기준으로 하므로 사실관계와 달라도 이것을 사실인 것처럼 표현하는 것이죠.
이와 함께 ‘표절과 저작권’이라는 윤리 문제나, 현재 수준에서 한국어에 대한 부족한 지원과 같은 문제들은 아직도 해결이 필요한 상황입니다. 위에서 언급한 문제들은 아직 뾰족한 해결책이 없어서 아직은 더 지켜봐야 한다는 것이 저의 개인적인 생각입니다. 물론, 압도적으로 빠른 속도와 다양한 프로그래밍 언어를 지원한다는 점을 고려해본다면 확실히 엄청난 성능인 것은 분명하고요.
* 할루시네이션(Hallucinations, 환각) 에러 : 생성형 인공지능이 모르는 것을 그럴듯한 표현으로 아는 척하는 현상
Q. 더욱 발전된 챗GPT가 프로그래밍 분야에 끼칠 영향에 대해서 전망해주신다면?
A. 사실 이러한 혁신과 변화가 챗GPT가 처음은 아닙니다. 앞서 말씀드렸던 노코드 툴의 경우에도 몇 년 전부터 이미 유행하고 있고, 챗GPT의 이전 모델인 GPT-3를 활용한 코드 생성 인공지능도 이미 선보여진 바 있죠. 이외에도 구글(알파코드)이나 마이크로소프트(코덱스), 네이버(클로바스튜디오) 등에서도 인공지능을 활용한 프로그래밍 서비스를 제공하고 있습니다.
저는 이러한 변화가 긍정적으로 작용할 것으로 생각하는데요. 개발자들은 끝없는 반복 작업에 고생하지 않아도 될 것이며, 무한한 모방과 학습을 통해 얻어지는 이러한 창의성으로 혁신을 만들 수 있을 것입니다. 물론, 인공지능 기술이 더욱 발전함에 따라 향후에는 단순한 프로그래머보다는 인공지능과 잘 소통할 수 있는 인공지능 프롬프트 엔지니어(AI Prompt Engineer)가 더 주목받을 수도 있겠죠.
지금까지 세 가지 사례를 통해 챗GPT의 수준과 향후 성장성을 살펴보았다. 이러한 챗GPT의 뛰어난 성능을 적극 활용하는 국내 기업들도 있다. SK텔레콤은 챗GPT 기반의 인공지능 대화 서비스 에이닷(A.)을 통해 최적화된 인공지능 서비스를 제공하고 있다. 특히, 에이닷을 위해 자체 기술로 제작한 슈퍼컴퓨터 타이탄(TITAN)을 구축하기도 했다. 에이닷 서비스를 담당하는 김승식 SK텔레콤 GLM모델링팀 매니저는 “챗GPT가 자연어 처리 분야에서 큰 주목을 받고 있는데, 에이닷은 자연어 처리 능력에 더해 한국어에 특화된 모델인 점이 강점이다”라며 “한국어 학습에 있어서는 더 높은 이해력과 활용도를 기대할 수 있을 것”이라고 밝히기도 했다.
Q. 최근 뜨거운 관심을 받고 있는 챗GPT 기반의 인공지능 서비스 ‘에이닷’에 대한 간단한 설명 부탁드립니다.
A. 에이닷은 GPT-3 모델을 기반으로 하는 인공지능 대화 서비스인데요. 일상 대화 형식의 사용자 인터페이스를 통해 사용자와 인공지능의 자연스러운 대화를 이어갈 수 있습니다. 모델에 학습된 다양한 분야의 지식과 정보를 전달할 뿐 아니라 사용자 맞춤형 서비스로 원하는 콘텐츠를 제공하기도 합니다.
저희 에이닷은 ‘사용자 교감을 통해 성장하며 진화하는 서비스’를 지향하고 있는데요. 사용자와 높은 수준의 ‘지식 대화’, 친구와 대화하는 듯한 ‘감성 대화’ 사용자가 원하는 서비스를 더 쉽게 제공할 수 있도록 하는 ‘목적 대화’에 집중하고 있습니다.
▲ 슈퍼컴퓨터 타이탄(TITAN)의 실제 모습(출처 : SK텔레콤)
Q. 인공지능 서비스를 위해 구축한 ‘타이탄’에 대해서도 자세히 설명해 주시겠어요?
A. 네. 앞서 말씀드린 대로 타이탄은 에이닷을 위해 구축한 슈퍼컴퓨터인데요. 국내에서 가장 강력한 GPU 기반의 슈퍼컴퓨터로 하드웨어와 소프트웨어 측면에서 봤을 때 과학 기술 연산에 초점이 맞춰진 그동안의 슈퍼컴퓨터와 다르게 인공지능 구동에 최적화된 슈퍼컴퓨터로 이해하시면 될 것 같습니다. 특히, 저희 SK텔레콤 자체 기술로 만든 슈퍼컴퓨터이기 때문에 추후 개발에 따른 인공지능의 변화에 발 빠르게 대응할 수 있다는 장점이 있습니다.
에이닷이 거대 언어 모델에 기반을 둔 서비스이기 때문에 모델을 학습하기 위해 대량의 GPU 리소스를 필요로 하는데요. 이 때문에 타이탄에서는 1,040개의 NVIDIA A100 80G 제품을 사용하고 있습니다. 해당 제품에는 SK하이닉스의 HBM2E가 적용돼 있는데요. HBM2E는 초당 2테라바이트(TB) 이상의 메모리 대역폭 제공을 통해 더 빠른 데이터 처리를 돕고 있습니다. 이는 용량뿐 아니라 대역폭 측면에서도 국내에 구축된 슈퍼컴퓨터 중 가장 뛰어난 수준입니다.
결국 수많은 인공지능을 제대로 구현하기 위해선 반도체가 꼭 필요하다. 인공지능은 엄청난 양의 데이터를 최대한 빠르고 효율적으로 처리해야 하는데, 이러한 데이터 처리는 메모리 칩과 같은 하드웨어에서 담당하고 있기 때문이다.
그렇다면 인공지능을 구현하는 과정에서 반도체는 어떤 역할을 하게 될까? 인공지능과 반도체의 상관관계를 SK하이닉스의 제품을 기준으로 살펴보도록 하자.
SK하이닉스에서 생산하는 많은 반도체 중에서도 ‘인공지능 반도체’로 주목받고 있는 것은 HBM과 PIM이다. 이 두 반도체가 무엇인지 살펴보고, 인공지능을 구현하기 위해 어떤 역할을 하는지 알아보기 위해 SK하이닉스 이현배 TL(HBM기술전략)과 장택완 TL(Solution AT)과의 미니 인터뷰를 준비했다.
Q. 최근 챗GPT 등 인공지능이 높은 관심을 받으면서 PIM과 HBM 등 이른바 ‘인공지능 반도체’라 불리는 제품들이 주목받고 있는데요. 각각 해당 제품에 대해서 간단히 설명해주세요.
장택완 TL 지능형 메모리라고도 불리는 PIM(Processor-In-Memory)은 CPU에서 수행하는 연산 작업의 일부를 메모리에서 직접 수행할 수 있도록 만든 제품인데요. 엄청난 양의 데이터를 처리해야 하는 인공지능 컴퓨팅 과정에서 데이터 이동 간 발생하는 병목현상을 제거하는 데 아주 효과적인 제품입니다.
특히 PIM은 메모리에서 CPU로 데이터가 이동하는 것을 줄여, 컴퓨터의 전력 소모도 줄일 수 있는 제품이기도 합니다. 2022년 2월 저희 SK하이닉스가 개발한 PIM 제품인 GDDR6-AiM은 메모리 사용이 많이 필요한 연산에서 최대 16배 빠른 속도를 낼 수 있으며, 전력 소모 역시 80% 절감할 수 있습니다.
이현배 TL 여러 개의 DRAM Core를 TSV(Through Si Via, 실리콘 관통 전극) 적층이라는 고도의 기술로 구현한 것이 HBM(High Bandwidth Memory)인데요. 일반적인 DRAM보다 압도적으로 높은 성능의 제품이라고 생각하시면 좋을 것 같습니다. 챗 GPT와 같은 인공지능은 GPU(Graphic Process Unit) 등을 통해 아주 방대한 양의 데이터를 복잡한 연산을 통해 처리하는데요. 여기서 이런 방대한 양의 데이터를 일시적으로 처리할 수 있는 고효율/고성능 메모리인 것이죠.
더 많은 데이터를 더 빠르게 처리하는 과정에 가장 큰 문제는 데이터 이동 간 발생하는 병목현상인데요. HBM은 더 빠른 동작 속도를 자랑하면서도 고대역폭을 제공함으로써 더 많은 데이터가 동시에 이동할 수 있도록 하고 있습니다. 인공지능을 구현하기 위해 최적의 제품입니다.
Q. ‘인공지능 반도체’의 미래는 무엇이라고 생각하시나요?
장택완 TL 미래의 초거대 인공지능 모델에서는 학습뿐만 아니라 ‘추론’ 과정도 상당히 중요합니다. 추론 과정에서 메모리 접근이 빈번하게 발생하기 때문에 결국, 메모리 자체에서 연산이 가능한 PIM은 뛰어난 성능을 보일 수밖에 없죠. 결국 PIM과 같은 인공지능 반도체는 필수 요소이고 그 필요 수량은 지속 성장한다고 말할 수 있습니다.
Q. 챗GPT와 같은 인공지능의 열풍이 반도체 업계에 끼치는 영향은 무엇이 있을까요?
이현배 TL 우리 인류는 지속해 방대한 양의 데이터를 효과적으로 처리하고자 하는 니즈가 있었습니다. 방대한 데이터를 학습해 구현에 성공한 지금의 인공지능이 이러한 니즈를 방증하는 결과물이기도 하죠. 결국 더 많은 데이터를 생성하고, 처리하기 위해 메모리 반도체에 대한 수요는 더욱 늘어날 것으로 생각합니다.