AI가 일상이 된 ‘대 AI 시대’, 그 무한한 가능성을 해독하기 위해 SK하이닉스 뉴스룸이 야심 차게 선보이는 [DECODE AI] 시리즈! 각 분야의 최고 전문가들과 함께, 우리 삶 곳곳에 스며든 AI를 샅샅이 파헤칩니다.
2편에서는 과학을 혁신할 AI를 살펴볼 예정입니다. 국내 최고의 과학 유튜브 채널, ‘안될과학’의 과학커뮤니케이터 ‘항성’이 알려주는 과학계 AI 이야기! 노벨 화학상을 받은 AI를 포함해 인류의 역사를 다시 쓸 AI를 소개합니다.
▲ 실생활에 사용되고 있는 다양한 AI 사용 예시
요즘 AI(인공지능)의 발전 속도는 실로 눈부십니다. 글을 쓰고, 그림을 그리고, 요리 레시피를 추천하는 수준을 넘어, 이제는 과학 연구의 본질적인 패러다임마저 바꾸고 있죠. 그 배경에는 현대 과학이 다루는 방대한 정보량과 복잡성이 자리하고 있습니다. 수많은 실험 조건, 거대한 데이터, 수백 개의 변수들. 사람이 일일이 처리할 수 없는 것은 아니지만, 그만큼 시간은 많이 들고, 성과를 내기까지 효율이 떨어진다는 한계가 존재합니다.
이런 한계를 뛰어넘기 위해 AI는 연구 현장에서 필수적인 도구가 되고 있습니다. 인간이 감당하기 어려운 방대한 데이터를 빠르게 분석하고, 가능성 있는 조합을 제시하며, 복잡한 예측 모델을 수립하는 능력은 과학의 더 빠른 진보를 가능하게 하죠.
이제 과학자는 질문을 던지고, AI는 그 해답의 방향을 제시하는 시대입니다. 단순한 계산기를 넘어, 연구 파트너이자 실험 설계자, 데이터 분석가로 진화한 AI의 모습은 미래 과학의 동반자 그 자체인 것이죠.
생명의 구조를 해석하는 AI: 알파폴드(AlphaFold)
▲ 구글 딥마인드의 단백질 구조 예측 AI, 알파폴드
단백질은 생명의 기본 단위입니다. 세포의 형태 유지부터 호르몬 분비, 면역 작용, 대사 조절에 이르기까지 대부분의 생명 활동은 단백질의 기능에 의해 좌우되죠. 그런데 이 기능은 단백질이 어떤 3차원 구조로 되어 있느냐에 따라 결정됩니다. 즉, 구조를 알아야 기능을 알 수 있죠. 하지만 단백질 구조를 실험적으로 분석하는 일은 수개월에서 수년이 걸리는 고난도의 작업인데요. 그 난제에 정면 돌파를 시도한 AI가 바로 알파폴드(AlphaFold)입니다.
알파폴드는 구글 딥마인드와 워싱턴대학교의 데이비드 베이커(David Baker) 교수팀이 공동 개발한 인공지능 모델입니다. 이 모델은 단백질의 아미노산 서열만 입력하면, 그에 따른 3차원 구조를 예측해 내죠. 처음 등장한 알파폴드1은 단백질 구조 예측에 AI를 본격적으로 활용할 수 있음을 보여줬지만, 약 60% 수준의 정확도에 머물러, 실제 연구 현장에서 활용하기에는 다소 부족한 면이 있었습니다.
▲ 자유 모델링 영역에서 예측 정확도의 중앙값(©Google DeepMind)
이후 성능이 대폭 향상된 알파폴드2는 90% 이상의 예측 정확도를 기록하며, 인간 연구자보다도 더 정확한 수준에 도달했죠. 이처럼 눈부신 성능 향상은 방대한 단백질 구조 데이터를 학습한 딥러닝 기술과 이를 뒷받침하는 고성능 연산 인프라가 있었기에 가능했습니다.
또한 알파폴드의 진정한 혁신은 오픈 사이언스를 지향했다는 점입니다. 딥마인드는 2억 개가 넘는 단백질 구조 예측 데이터를 전 세계에 무료로 공개했고, 현재 200만 명 이상의 연구자들이 이를 활용하고 있습니다. 이는 코로나19 백신의 신속한 설계, 알츠하이머와 같은 난치성 질환의 메커니즘 분석, 플라스틱 분해 효소 개발 등으로 이어져 과학계에서 가장 활발하게 활용되는 AI라고 할 수 있습니다.
▲ 2024년 노벨 화학상 수상자 (©The Royal Swedish Academy of Sciences)
2024년, 알파폴드를 개발한 데미스 하사비스(Demis Hassabis), 존 점퍼(John M. Jumper), 데이비드 베이커(David Baker)는 노벨 화학상을 공동 수상하며, AI 기반 기술로는 최초로 노벨상의 영예를 안았습니다. 또한, 같은 해 5월에 공개된 알파폴드3는 단백질 간 상호작용뿐 아니라 DNA, RNA, 항체, 리간드* 등 다양한 생체분자와의 상호작용까지 예측하면서 바이오 연구에 더욱 강력한 도구로 자리 잡았죠. 다만 알파폴드3는 소스코드를 비공개로 전환하면서 과학계의 오픈 사이언스 가치에 대한 논란을 불러일으키기도 했습니다.
* 리간드(Ligand): 생물학적 목적을 위해 생체분자와 복합체를 형성하는 물질이다. 단백질-리간드 결합에서 리간드는 단백질의 특정 부위에 결합해 신호를 발생시키는데, 이러한 결합은 표적 단백질의 입체구조적 변화를 초래한다.
세상에 없던 물질을 찾는 AI: 구글놈(GNoME)
▲ 구글 딥마인드의 신소재 모델 예측 AI, 구글놈
AI는 세상에 없는 물질까지도 찾아내며 과학의 또 다른 영역을 개척하고 있습니다. 특히 신소재 개발 분야가 그 대표적인 사례죠. 수천 가지 원소의 다양한 조합과 수많은 결정 구조, 복잡한 물성 속에서 새로운 소재를 발견하는 일은 가내수공업에 가까운 노력이 필요했습니다. 새로운 물질 하나를 찾는 데 수년이 걸리는 일도 흔했죠. 하지만 이제는 AI가 신소재 연구의 핵심으로 자리 잡고 있습니다. 그 대표적인 AI가 바로 구글 딥마인드가 2023년 말에 발표한 구글놈(GNoME, Graph Networks for Materials Exploration)입니다.
구글놈은 기존에 알려지지 않은 신소재를 빠르고 정확하게 예측할 수 있는 AI 모델입니다. 수십만 개에 달하는 결정 구조 데이터를 학습한 뒤, 그 안에서 원자 간 결합 규칙과 에너지 안정성의 패턴을 추출하는데요. 이후 가능한 조합을 시뮬레이션해, 고체 결정으로써 안정적으로 존재할 가능성이 높은 물질 후보를 자동으로 생성하는 방식이죠. 이 예측 과정은 단순한 패턴 매칭을 넘어, 양자역학 기반 계산과 보로노이 알고리즘* 같은 물리 기반 모델링을 포함하고 있어 더욱 정밀합니다.
* 보로노이 알고리즘: 하나의 공간에 여러 점이 있을 때, 각 점이 차지하는 ‘가장 가까운 구역’을 계산해 내는 알고리즘
양자역학 계산은 원자들이 어떻게 상호작용하고 전자가 어떤 궤도로 움직이는지를 분석하여, 해당 조합이 물리적으로 존재 가능한지를 평가합니다. 한편, 보로노이 알고리즘은 각 원자가 공간에서 차지하는 영역과 이웃 원자와의 거리 분포를 기반으로, 충돌 없이 안정적인 결정 구조를 형성할 수 있는지를 따지죠. 이처럼 양자역학의 미시적 상호작용과 공간 기하 구조까지 함께 고려하기 때문에, 구글놈의 예측은 단순한 데이터 기반 추정보다 훨씬 더 물리적으로 타당하고 실험 가능성이 높은 결과를 도출할 수 있는 겁니다.
▲ 여러 방법을 통해 발견한 안정적인 신소재 개수(©Google DeepMind)
이렇게 철저한 이론 기반 시뮬레이션을 통해 구글놈은 무려 250만 개 이상의 신소재 후보군을 생성했고, 이 중 약 38만 개는 실험적으로도 안정적일 가능성이 매우 높은 것으로 평가됐습니다. 이는 기존 방식대로라면 수천 명의 과학자가 수십 년을 투자해야만 달성할 수 있는 규모인데요. 이를 통해 AI가 과학의 속도를 얼마나 빠르게 바꾸고 있는지를 단적으로 볼 수 있죠.
현재 구글놈은 배터리, 반도체, 초전도체, 에너지 저장 소재 등 첨단 재료 산업의 핵심 분야에서 실제 후보 물질 탐색에 적극적으로 활용되고 있습니다. 특히 차세대 에너지 소자나 양자컴퓨팅용 소재처럼 실험 접근이 어려운 분야에서는 구글놈이 제안하는 후보군을 바탕으로 연구의 방향을 설정하는 사례가 늘고 있죠. 구글놈은 단순한 계산 도구를 넘어, 인간이 아직 도달하지 못한 물질의 가능성을 열어주는 ‘지능형 과학 파트너’로 자리 잡아 가고 있습니다.
분자의 언어를 이해하는 AI: 켐프롭(Chemprop)
▲ 분자의 화학적 특성을 예측하는 AI 모델, 켐프롭
화학은 오랜 시간 동안 ‘직관’과 ‘경험’의 학문으로 여겨져 왔습니다. 수많은 화합물의 특성과 반응 경로를 예측하려면, 복잡한 이론 지식과 오랜 실험 경험이 필수였죠. 하지만 최근 AI는 분자의 특성을 해석하는 방식을 근원적으로 바꾸고 있습니다. 바로 그 중심에 있는 기술이 켐프롭(Chemprop)입니다.
▲ 켐프롭은 분자식이나 구조식으로 표현되던 기존 화학 모델링을 GNN을 통해 그래프로 표현(©Wojtuch, Agnieszka, et al. “Extended study on atomic featurization in graph neural networks for molecular property prediction.” Journal of Cheminformatics 15.1 (2023): 81.)
켐프롭은 2019년 MIT의 그린 연구실에서 개발된 분자 특성 예측 AI 모델입니다. 켐프롭의 가장 큰 특징은, 기존 화학 모델링과는 전혀 다른 방식으로 분자를 인식한다는 점이죠. 전통적인 모델은 분자를 원자 배열이나 화학식으로 단순하게 표현했지만, 켐프롭은 조금 특별합니다. 분자를 단순한 화학식이 아닌, 원자(Node)와 결합(Edge)으로 구성된 그래프 형태로 인식하고, 그래프 신경망*을 활용해 분자 내에서 일어나는 전자 이동과 상호작용을 학습하는 것이죠. 이 방식은 기존 모델보다 훨씬 더 정밀하게 분자의 물리적, 화학적 특성을 예측할 수 있게 해줍니다.
* 그래프 신경망(GNN, Graph Neural Network): 그래프 구조의 데이터를 효과적으로 학습하기 위한 딥러닝 모델, 그래프의 개별 객체인 원자를 나타내는 노드(Node)와 노드 간의 관계나 연결, 결합을 나타내는 엣지(Edge)를 통해 학습한다.
▲ 물 분자로 알아본 노드와 엣지
또한 켐프롭은 독성, 용해도, 안정성, 생물학적 활성 등 다양한 특성을 예측할 수 있으며, 이를 통해 신약 후보 물질의 성능과 부작용을 미리 파악할 수 있는데요. 실제로 머크, 노바티스 등 글로벌 제약사들은 켐프롭을 도입해 신약 개발 기간을 1~2년 단축하는 데 성공했죠. 그렇기에 켐프롭은 신약 개발 분야에서 강력한 도구로 떠오르고 있습니다.
게다가 켐프롭은 지속 가능한 화학 물질 개발에도 활용됩니다. 플라스틱 대체 소재나 친환경 촉매 개발 과정에서 실험 전 물질의 가능성을 빠르게 예측함으로써 자원 낭비를 줄이고 환경 부담을 줄이는 ‘그린 AI’로도 주목받고 있습니다.
무엇보다 켐프롭은 오픈소스로 공개돼 있다는 점에서 접근성과 확장성이 뛰어나 전 세계의 대학 연구실이나 스타트업도 손쉽게 자체 예측 모델을 만들 수 있고, 몇 줄의 코드만으로 특정 화합물 군에 특화된 분석 시스템을 구축할 수 있습니다. 이로써 켐프롭은 화학의 세계를 해석하는 방식을 근본부터 다시 쓰고 있는 중이죠.
하늘을 감시하는 AI: 헬리오링크3D(HelioLinc3D)
▲ 소행성 탐지 AI, 헬리오링크3D
생명과 물질, 화학을 넘어 AI는 이제 우주의 질서를 읽기 시작했습니다. 워싱턴대학교에서 개발한 헬리오링크3D(HelioLinc3D)는 소행성 탐지를 위한 AI 알고리즘으로, 천문학계의 새로운 표준을 제시하고 있습니다.
▲ 짧은 시간 동안 동일한 천체가 연속적으로 관측되면 궤도를 추정하는 방식(© JPL | NASA Center for Near-Earth Object Studies)
기존의 소행성 탐지는 ‘Tracklet-based linking*’ 방식으로, 하룻밤 사이 동일한 천체가 최소 4회 이상 연속적으로 포착돼야 궤도 추적이 가능했습니다. 따라서 밝고 빠르게 이동하는 소행성만 탐지가 가능했고, 느리게 움직이거나 희미하게 보이는 천체는 아예 데이터에서 제외되는 경우가 많았죠.
하지만 헬리오링크3D는 전혀 다른 접근을 시도했는데요. 다른 날, 다른 위치에서 촬영된 흩어진 관측 데이터를 AI가 스스로 연결해 하나의 궤도를 추론한 것입니다.
헬리오링크3D는 수백만 개의 관측 데이터를 동시에 분석하며, 밝기, 속도, 방향, 위치 등을 바탕으로 잠재적 천체 후보를 추론하고, 이들을 하나의 천체로 연결해 냅니다. 흩어진 정보를 통합하고, 3차원 궤도 해석 모델과 일치시키는 기술이 바로 헬리오링크3D의 핵심이죠. 이 과정을 통해 기존 시스템에서는 놓쳤던 천체들까지 포착할 수 있게 되었습니다.
* Tracklet-based linking(트랙렛 기반 연결): 짧게 추적한 여러 객체 경로(Tracklet)를 나중에 이어 붙여 하나의 긴 이동 경로를 복원하는 기법이다. 가려짐이나 일시적 손실을 보완해 지속적인 추적을 가능하게 한다.
▲ 여러 날 나눠 찍힌 데이터 조각들을 모아 하나의 궤도로 재구성(©ATLAS/University of Hawaii Institute for Astronomy/NASA)
실제로 2023년, 헬리오링크3D는 기존 탐지 방식으로는 확인할 수 없었던 소행성 ‘2022 SF289’를 조기에 포착하며 주목받았는데요. 이 소행성은 천천히 움직였고, 배경 별빛과 겹쳐 있었으며, 관측 데이터가 서로 다른 날짜와 위치에 흩어져 있어 기존 방식이라면 아예 탐지 시도조차 어려운 대상이었죠.
하지만, 헬리오링크3D는 서로 다른 날짜에 촬영된 단편적 관측 데이터를 마치 흩어진 퍼즐을 맞추듯이 결합해 새로운 소행성 궤도를 찾아낸 것이죠. 이 기술은 향후 미국의 초대형 관측 프로젝트 LSST*에 본격적으로 도입될 예정이며, 매일 수십 테라바이트(TB)에 달하는 우주 데이터를 분석하는 데 필수적인 역할을 하게 될 것입니다.
* LSST(Legacy Survey of Space and Time, 우주와 시간의 유산 관측 프로젝트): 미국에 위치한 버라 루빈(Vera Rubin) 천문대에서 진행하는 대규모 프로젝트, 10년 동안 약 370억 개의 천체를 관측하는 프로젝트로 수많은 천체의 변화를 기록한다.
AI는 과학의 파트너가 되고 있다
▲ 단순한 조력자를 넘어 실험 설계, 데이터 분석, 시뮬레이션 예측 역할까지 하는 AI
과학의 본질은 질문과 관찰, 그리고 해석입니다. 지금까지는 이 과정의 중심에 사람이 있었다면, 이제 AI는 실험 설계자이자 데이터 분석가, 탐색자, 심지어는 우주의 감시자 역할까지 수행하고 있죠.
알파폴드는 생명의 퍼즐을 풀고, 구글놈은 신소재의 지도를 새로 그리고 있으며, 켐프롭은 분자의 언어를 해석하고, 헬리오링크3D는 보이지 않던 천체를 추적합니다. 각기 다른 분야의 AI들이 과학이라는 하나의 목표를 향해 달려가고 있는 것이죠. 이러한 AI 기술들의 발전 뒤에는 SK하이닉스와 같은 기업들의 끊임없는 기술 혁신이 중요한 기반이 되고 있습니다.
▲ 과학계 패러다임을 바꿀 AI 기술 발전에 기여하고 있는 SK하이닉스
물론 AI는 만능은 아닙니다. 인간의 직관, 윤리적 판단, 창의성은 여전히 과학의 핵심 자산입니다. 그러나 분명한 사실은 AI는 과학의 속도를 바꾸고 있고, 이제 과학은 AI와 함께 앞으로 나아가야 한다는 점입니다. AI 기술의 발전과 함께 데이터 편향성, 악용 가능성 등 윤리적인 문제에 대한 심도 있는 논의와 안전장치 마련 또한 중요합니다.
미래에는 또 어떤 AI 기술이 과학의 다음 챕터를 열게 될까요? 그 여정을 기대해 봐도 좋을 것 같습니다.