최근 인공지능(AI)이 반도체 업계의 매력적인 시장으로 부상하고 있습니다. 구글, 애플, 페이스북, 아마존, 바이두, 텐센트, 알리바바 등 세계적인 정보기술(IT)업체들이 모두 AI 시스템에 막대한 투자를 하고 있기 때문인데요. 반도체 업계 고위 관계자는 “사물인터넷(IoT) 시장은 값이 싼 반도체가 많이 필요한 반면, AI 업체들은 값이 비싸도 최고급 최고성능을 내는 반도체를 필요로 한다”며 “반도체 업체들이 AI 시장을 겨냥한 칩들을 집중 개발하고 있다”고 말하고 있습니다. AI 시장에 도화선을 그은 기술과 AI 업계가 원하는 최고 성능의 반도체는 어떤 것인지 알아보도록 하겠습니다.
AI 업계에 불을 붙인 GPU
AI가 업계의 화두로 떠오른 건 엔비디아가 지난해 폭풍 성장을 한 것이 직접적 계기가 되었습니다. 엔비디아는 2016년 매출이 69억 1000만 달러로 전년에 비해 37.9%, 영업이익은 19억 3400만 달러로 158.9% 급증했는데요. 이는 주력제품인 그래픽처리장치(GPU)가 AI용 서버에 집중적으로 채용되면서 수만 달러의 고가의 제품임에도 불티난 듯 팔렸기 때문이죠.
5년 전만 해도 엔비디아에 대한 관심은 이렇게 크지 않았는데요. 엔비디아의 GPU는 게임이나 영상편집 등 멀티미디어 작업에서 그래픽을 빨리 처리하기 위해 CPU를 보조하는 부품이었습니다.
그랬던 GPU가 AI 혁명의 총아로 각광받기 시작한 건 2010년부터입니다. AI 분야 석학인 앤드루 응 스탠퍼드대 교수는 12개의 GPU가 무려 2,000개의 CPU에 맞먹는 딥 러닝 성능을 발휘한다는 사실을 발견한 것인데요. 딥 러닝은 인간 신경망 구조를 본뜬 기계학습(머신러닝)의 일종으로 컴퓨터가 스스로 문제 해결 방법을 찾아내는 기술을 말합니다.
CPU | GPU | |
1~8개 | 코어수 | 수 백 ~ 수 천 개 |
빠름 | 코어별 속도 | 느림 |
직렬처리방식 | 연산처리방식 | 병렬처리방식 |
직렬, 병렬처리 모두 가능하지만 병렬처리 성능은 GPU보다 떨어짐 | 특징 | 많은 수의 코어를 탑재해 그래픽처리 등 병렬연산에 적합. GPU는 병렬연산만 가능하지만 CPU처럼 범용연산가능하게 구성한 GPGPU도 등장 |
GPU는 2012년 열린 소프트웨어로 사진을 인식해 사물이나 배경이 무엇인지 맞히는 프로그래밍대회인 ‘이미지넷 대회’에서 놀라운 성능을 내면서 GPU는 인공지능 학계의 ‘스타’가 되었습니다. 당시 토론토대 박사과정을 밟고 있던 알렉스 크리제브스키(현 구글 머신러닝팀 엔지니어)는 사진인식 프로그램에 처음으로 GPU를 이용해 ‘마의 장벽’으로 여겨지던 인식률 80%를 넘기면서 학계를 뒤흔들었죠. 이후 AI를 연구하려는 사람들은 모두 엔비디아 GPU로 몰려들었습니다.
지난해 이세돌 9단을 꺾은 구글 딥마인드의 AI 컴퓨터 ‘알파고’를 만드는 데에도 CPU 1,202개와 더불어 176개의 GPU가 들어갔습니다. 미국 유명 과학잡지 포퓰러사이언스는 지난해 GPU를 소개하는 기사에서 “GPU는 현대 AI 기술을 완성할 핵심 전력”이라고 쓸 정도였죠.
▲CPU(왼쪽)과 GPU(오른쪽) 구조를 나타낸 개념도
이렇듯 GPU가 AI에 강한 것은 방대한 양의 정보를 한꺼번에 처리할 수 있어서 입니다. CPU는 직렬처리 방식(한 가지 작업을 마친 뒤 다음 작업을 처리)에 최적화된 1~8개의 코어로 구성되어 있어 명령어가 입력된 순서대로 순차적으로 데이터를 처리하는데요. 구조상 수많은 정보가 한꺼번에 들어오면 병목현상이 생기기 때문에 비효율적입니다. 반면 GPU는 수백에서 수천 개의 코어가 들어가 있어 대량의 데이터를 너끈히 처리할 수 있습니다.
예를 들어 점을 하나씩 찍는 방식으로 그림을 그린다면 CPU는 붓을 움직이는 속도는 빠르지만 한 번에 한 개의 점만 찍을 수 있어 그림 하나를 완성하려면 많은 시간이 걸립니다. 하지만 GPU는 손놀림은 느리지만 한꺼번에 수천 개의 붓을 동시에 쥐고 있어 붓질 한 번에 그림을 완성할 수 있는 것과 같은 원리입니다.
고속성장하고 있는 AI 기술
엔비디아는 지속적으로 GPU를 AI에 맞춰 개발하기 시작했고, 지난 3년간 50배 이상 성능을 높였습니다. 향후 몇 년 내에 10배 이상 더 빠르게 만들겠다는 게 엔비디아의 계획인데요. 지난해 4월에는 20억 달러를 투자해 칩 1개에 1,500억개의 트랜지스터가 들어간 최첨단 GPU인 테슬라 P100 칩을 개발하고 이 칩을 응용한 시스템을 선보였습니다.
DGX-1이라고 명명된 이 시스템은 8개의 테슬라 P100 GPU를 채용해 종전 엔비디아의 최고 시스템에 비해 머신러닝 기능이 12배 빨라졌는데요. 가격은 무려 12만 9,000달러, 칩 1개가 1만 6,125달러에 달하는 셈이죠. 젠슨황 최고경영자(CEO)는 DGX-1 시스템을 “야수같은 머신”이라고 불렀습니다.
고가의 가격임에도 불구하고 이 시스템은 날개 돋친 듯 팔려나가고 있습니다. MIT와 스탠퍼드, 버클리 등의 AI 과학자들이 먼저 사들였고 구글, 아마존, 페이스북 등도 이 시스템을 채용한 것으로 전해졌죠. 현재 바이두, 구글, 페이스북, 마이크로소프드 등은 모두 딥러닝에 엔비디아 GPU를 사용하고 있는데요. 지난 2년간 딥러닝 시스템에 엔비디아 GPU를 쓰는 회사는 3,400개로 35배 이상 늘어났습니다. 본격적으로 AI가 확산되며 자율주행차, 건강관리부터 자율주행, 금융서비스 기업 등으로 고객들이 확대되고 있기 때문이죠.
테슬라는 자사의 모든 자율주행차에 엔비디아 GPU를 이용하겠다고 지난해 발표했습니다. 자율주행 차량은 지속적으로 주변 상황에 관한 정보를 수집하고 많은 양의 데이터를 빠르게 분석해 판단을 내려야 하기 때문에 GPU의 사용이 필수적이기 때문이죠.
AI 시장을 정조준한 반도체 업계의 흐름
시장조사업체 IDC는 세계 인공지능 시스템 시장 규모가 지난해 80억 달러에서 2020년 470억 달러(약 53조 6,740억원)로 늘어날 것으로 추산했는데요. AI 시장은 이처럼 급성장하고 있습니다. 이 때문에 반도체 업계는 AI용 반도체 제품을 잇따라 쏟아내고 있죠.
SK하이닉스도 지난해 10월 스탠퍼드대와 뉴로모픽(Neuromorphic, 뇌신경 모방)칩 연구개발협약을 맺고 AI 시장을 정조준 했습니다. 사람 뇌의 사고과정을 모방한 뉴로모픽 아키텍처는 GPU와 FPGAs(Field Programmable Gate Arrays)를 기반으로 개발된 반도체인데요. 기계가 쉽게 인식하기 어려운 비정형적인 문자와 이미지, 음성, 영상 등의 데이터도 효율적으로 처리할 수 있죠. 인간의 뇌처럼 적은 에너지로도 기억과 연산을 동시에 처리하는 저전력 고성능 반도체를 만들겠다는 계획입니다.
삼성전자도 D램과 낸드플래시를 조합해 일반 SSD보다 속도를 대폭 높인 Z-SSD를 판매하기 시작했습니다. 이 제품 또한 AI용 서버를 겨냥하고 있죠. 구글은 최근 자체 개발한 머신러닝 프로세서인 TPU(Tensor Processing Unit)가 시판중인 엔비디아 GPU와 인텔 CPU에 비해 15배에서 30배까지 빠르다고 발표했습니다. 머신러닝과 구글의 머신러닝 개발 프레임워크인 텐서플로 용으로 개발된 TPU는 2015년부터 구글 데이터센터들에서 사용돼 왔는데요. TPU는 전통적인 프로세서에 비해 에너지 효율성도 높은 것으로 나타났습니다.
인텔은 지난달 ‘3D 크로스포인트’란 뉴메모리로 만든 옵테인 솔리드스테이트드라이브(SSD)를 내놓았습니다. 기존 낸드플래시로 만든 SSD보다 작업량에 따라 2.5배에서 최대 77배까지 빠른데요. 평균적으로는 7배의 성능을 낼 수 있습니다. 인텔은 이 제품이 AI와 머신러닝에 적합하다고 밝혔습니다.
GPU로 인해 불붙은 AI업계는 AI에 대한 기대와 활용도가 점점 커져가면서 급성장하고 있습니다. 급격하게 커지고 있는 AI용 반도체 시장에 발맞춰 반도체 업계의 불꽃 튀는 경쟁 또한 예상되는데요. 이런 변화 속에서도 한국의 반도체 업체들이 메모리 반도체 시장을 정복했듯이 좋은 결과를 냈으면 합니다.
※ 본 칼럼은 반도체/ICT에 관한 인사이트를 제공하는 외부 전문가 칼럼으로, SK하이닉스의 공식 입장과는 다를 수 있습니다.