AI가 일상이 된 ‘대 AI 시대’, 그 무한한 가능성을 해독하기 위해 SK하이닉스 뉴스룸이 야심 차게 선보이는 [DECODE AI] 시리즈! 최고 전문가들과 함께, 우리 삶 곳곳에 스며든 AI를 샅샅이 파헤칩니다.
5편에서는 디지털 세상을 만들어가는 핵심 기술, 소프트웨어 개발에서의 AI 활용에 대해 알아보겠습니다. 국내 최고의 소프트웨어 전문가인 ‘서울 AI 허브 박찬진 센터장’이 알려주는 소프트웨어 개발 AI의 모든 것, 지금부터 함께 살펴봅시다.
소프트웨어는 컴퓨터를 단순한 ‘기계’에서 ‘일상의 도구’로 바꾼 결정적인 열쇠였다. 소프트웨어의 발전은 인류 문명이 디지털 시대로 전환하는 데 핵심 역할을 했으며, 오늘날 우리의 삶을 완전히 바꿔 버렸다. 최근 인류 문명을 혁신할 기술이라 평가 받고 있는 인공지능(AI) 역시 소프트웨어가 만든 결과물 중 하나다.
2025년 현재, AI는 소프트웨어 개발 방식 자체를 근본적으로 재편하고 있다. 특히, ‘에이전트형(Agentic) AI’는 개발자의 개발을 돕는 단순한 ‘도구’를 넘어 문제 인식부터 해결, 실행, 개선까지 전체 주기를 수행하는 자율적 파트너로 진화하고 있다.
기술의 구조적 진화: ‘전문 AI’에서 ‘에이전트형 AI’로
AI 기술 발전은 대체로 두 단계로 요약된다. 첫 번째 단계는 특정 문제에 최적화된 ‘전문 AI(Specialized AI)’의 시대였다. 이 시기 AI는 정해진 작업을 빠르고 정확하게 처리하는 능력을 중심으로 설계됐다. 이를테면, 이상 탐지, 불량 분류, 예지 보전* 등 명확한 목표를 가진 모델들이 제조업과 산업 현장에서 널리 활용됐다.
두 번째 단계는 챗GPT와 같은 범용 거대언어모델(이하 LLM)*의 등장으로 시작됐다. 범용 LLM은 자연어를 이해해 사용자의 의도를 파악하고, 주어진 맥락에서 계획을 수립하며, 필요한 작업을 스스로 연결해 수행할 수 있는 AI이다. 기존의 전문 AI가 한 가지 과제에 집중했다면, 범용 LLM은 다양한 작업을 유기적으로 엮어내며 문제 해결 과정을 하나의 흐름으로 만들어 내는 역할을 하고 있다.
* 예지 보전(豫知保全): 각각의 설비 상태를 정량적으로 파악하여 설비의 이상 상태나 앞으로 일어날 수 있는 사태를 미리 예상하고 적절하게 유지하고 보수하는 일
* 거대언어모델(Large Language Model, LLM): 방대한 양의 데이터를 학습한 언어 모델로, 텍스트를 생성, 요약, 번역하는 등 생성형 AI 작업을 수행하는 데 필수적인 역할을 함
▲ [그림 1] 에이전트형 AI는 범용 LLM과 전문 AI 시스템을 통합해 반도체 장비 유지 보수에 활용될 수 있다.
이러한 기술 진화는 에이전트형 AI라는 새로운 형식을 만들었다. 에이전트형 AI는 기존의 단일 작업 중심 AI와 달리, 다양한 AI를 통합해 협업 및 동시다발적인 의사결정을 수행하는 고도의 자율성과 적응성을 가진 AI 시스템이다. 사용자의 최소한의 개입만으로도 목표를 설정하고 계획하며, 여러 단계의 복잡한 작업을 자율적으로 수행할 수 있다.
대표적인 예로, [그림 1]은 에이전트형 AI가 반도체 장비의 유지 보수 전체를 자동으로 관리하는 흐름을 보여준다. 장비 관리 에이전트(LLM)는 이상 탐지, 원인 분석, 예지 보전과 같은 전문 AI의 역할 뿐만 아니라 장비 유지 보수 매뉴얼, 고장 이력 데이터베이스 등의 기존 장비 관리 시스템과 협력해 개별 업무를 분해하고, 각 역할에 맞게 연계함으로써 문제를 해결해 나간다. 여기에, 중간중간 사용자의 피드백을 반영해 더 나은 결과를 만들어 내기도 한다.
이처럼 에이전트형 AI는 기존 ‘역할별 분업 구조’에서 ‘역할 융합형 자율 시스템’으로 업무 환경을 전환하는 데 핵심 역할을 하고 있다. 개발자, 시스템 설계자, 운영자 등으로 나뉘어 있던 역할을 통합적으로 수행하면서, 직무 간 경계를 허물고 있는 것이다.
바이브 코딩: AI가 만드는 새로운 패러다임
코드 작성이 사라지는 대화형 개발
최근에는 ‘바이브 코딩(Vibe Coding)’이라는 새로운 개발 방식이 주목받고 있다. 전(前) 테슬라 AI 책임자 안드레이 카르파티(Andrej Karpathy)는 바이브 코딩에 관해, “프로그래머가 코드를 작성한다는 느낌 없이, 감각적으로 AI와 함께 창작하는 것”이라고 설명했다.
예를 들어, 게임을 개발하는 과정에서 “캐릭터가 점프할 때 효과음을 넣어줘”라고 말하면 AI가 즉시 기능을 구현해 보여주고, 이후 대화하듯 수정 요청을 하면 바로 반영된다. 개발 과정이 명령과 실행의 반복이 아니라, 함께 조율하며 완성하는 협업의 흐름으로 바뀌는 것이다.
실제 사례도 등장하고 있다. 필자는 챗GPT 기반 툴을 활용해 해외 유학생과 국내 스타트업을 매칭하는 데이터 분석 프로그램을 제작한 바 있다. AI는 더미 데이터* 생성부터 UI* 구성, 로직 설계, 오류 수정까지 대부분의 과정을 수행할 수 있었으며, 필자는 방향성을 조율하는 역할에 집중할 수 있었다. 이는 AI가 단순한 도구를 넘어, 탐색적 개발과 창의적 설계의 동반자로 활용될 수 있음을 보여준다.
* 더미 데이터(Dummy Data): 실제 정보는 아니지만, 테스트나 실험을 위해 형식만 맞춰 만든 가짜 데이터
* UI(User Interface): 사람이 버튼, 메뉴, 아이콘 등 화면 요소를 통해 컴퓨터와 상호작용하는 접점으로, 직관적이고 효율적으로 작업할 수 있도록 설계된 인터페이스
데빈(Devin) AI와 코딩 에이전트형 AI의 출현
이러한 변화의 구조적 전환점을 보여준 사례는 2024년 공개된 ‘데빈(Devin) AI*’다. 세계 최초로 구현된 자율형 코딩 AI인 데빈은 에이전트형 AI로 단일 프롬프트만이 아니라 사용자의 요구사항을 해석하고 코드로 작성한 뒤 테스트, 디버깅*, PR* 제출에 이르는 개발 사이클을 스스로 수행한다.
또한, 최근 AI 코드 편집기 커서(Cursor)는 클로드(Claude)를 주력 백엔드 모델로 활용하며, 복잡한 코드 구조 이해와 리팩토링* 작업에서 우수한 성능을 보이고 있다. 사용자는 GPT-4 등 다른 모델로 전환해 작업 성격에 맞는 AI를 선택할 수도 있다.
* 데빈(Devin) AI: 세계 최초로 개발된 완전 자율 AI 소프트웨어 엔지니어. 요구사항에 맞춰 스스로 코딩, 테스팅, 디버깅, 배포까지 소프트웨어 공학 작업을 자동화하는 것을 목표로 함
* 디버깅(Debugging): 프로그램에 숨어 있는 오류(버그)를 찾아내고, 그 원인이 무엇인지 파악해 수정해 코드가 올바르게 실행되도록 하는 과정
* PR(Pull Request): 새롭게 작업한 코드를 기존 코드와 병합하기 위한 요청 프로세스
* 리팩토링(Refactoring): 기존에 동작하는 코드를 기능은 유지한 채 내부 구조만 깔끔하게 정리하거나 개선하는 과정으로, 코드를 더 읽기 쉽고 유지 보수하기 쉬운 형태로 바꾸는 작업
▲ 다양한 코딩 에이전트형 AI의 등장으로 소프트웨어 개발 환경이 급변하고 있다.
오픈AI(OpenAI)와 구글 같은 주요 AI 기업들 역시 올해 5월, 데빈과 유사한 기능을 가진 코덱스(Codex, 오픈AI)와 줄스(Jules, 구글) 등을 각각 공개하며, 본격적인 코딩 에이전트형 AI 시대의 시작을 알렸다. 이로써 AI는 단순한 보조자를 넘어 전체 개발에 대한 ‘실행의 주체’로 떠올랐다.
▲ [그림 2] 에이전트형 AI의 전체 개발 사이클 자동화 흐름
[그림 2]에 나타난 자동화 흐름은 에이전트형 AI가 깃허브* 기반 개발 프로세스를 완전히 통합·자동화하는 과정을 보여준다. 실제로 데빈 기반 시스템을 활용해 약 40만 줄의 코드를 자동 생성한 국내 대기업 사례도 소개됐는데, 이는 에이전트형 AI가 단순한 보조 도구를 넘어 실질적인 구현 주체로 기능할 수 있음을 시사한다.
* 깃허브(Github): Git 기반 온라인 소프트웨어 개발 플랫폼으로, 1억 명이 넘는 개발자가 사용하고 있으며, 개발자들은 깃허브에서 코드 저장소를 만들어 협업하고 공유한다. 이 때문에 현재는 오픈 소스의 중심지로 취급되고 있다.
전통 개발 방식과의 조화
그러나 혁신적인 개발 방식이라 하더라도 모든 상황에 적합한 것은 아니다. 여전히 많은 산업 현장에서는 V-모델* 기반의 전통 개발 방식이 중요한 역할을 하고 있다.
V-모델은 특히 계약 기반 개발이 중요한 금융, 공공, 산업용 시스템 분야에서 필수적이다. 이 모델은 특정 요구 사항이 어디에서 어떻게 구현되었는지를 추적할 수 있도록 해주며, 개발 결과물의 품질뿐만 아니라 개발 과정상의 품질까지 함께 검토하고자 할 때 유용하다. 예를 들어, 특정 프로젝트가 납품 전에 어떤 테스트를 반드시 거쳐야 하는지, 어떤 요구사항을 반드시 만족해야 하는지를 계약서나 제안요청서(RFP)를 통해 명시해야 하는 경우가 이에 해당한다.
반면, 바이브 코딩은 초기 아이디어 탐색, UX* 반복 설계, 그린필드 개발*에 적합하다. 빠른 피드백 루프를 통해 실험과 개선을 반복할 수 있기 때문이다. 결론적으로 두 방식은 상호 배타적이 아니라, 상호 보완적이다. 앞으로는 문제 정의 및 검증에는 전통적 접근을, 구현 및 탐색에는 바이브 방식을 접목하는 하이브리드 개발 전략이 필요하게 될 것이다.
* V-모델: 요구 분석, 시스템 설계, 모듈 설계, 구현 등의 각 단계마다 대응하는 검증 절차(단위 테스트, 시스템 테스트, 요구사항 검증)를 체계적으로 구성하는 방식
* UX(User Experience): 사용자가 제품이나 서비스를 사용할 때 느끼는 전반적인 경험(편의성, 감정, 만족도 등)을 포함하며, UI를 넘어 브랜드, 디자인, 기능 전반을 포괄하는 개념
* 그린필드(Greenfield) 개발: 기존 시스템이나 코드가 전혀 없는 상태에서 새로운 소프트웨어나 시스템을 처음부터 새로 만드는 개발 방식
AI로 재편되는 개발 생태계: 조직, 역할, 품질의 변화
▲ 구글의 CEO 순다르 피차이(왼쪽)와 MS의 CEO 사티아 나델라(오른쪽)(출처:구글, MS)
개발자의 역할 변화와 조직 구조의 진화
구글의 CEO인 순다르 피차이(Sundar Pichai)는 “신규 코드의 25% 이상이 AI에 의해 생성되고 있다”고 밝혔고, MS(마이크로소프트)의 CEO 사티아 나델라(Satya Nadella) 역시 “자사 코드의 20~30%는 AI가 작성한 것”이라고 밝혔다. 이는 AI가 개발 현장에서 본격적으로 활용되고 있다는 것을 시사하며, 동시에 개발자의 근본적인 역할이 다시 정의되고 있다는 것을 의미한다.
실제로 MS는 2025년, 6,000명의 감원을 발표했는데, 이중 800명이 개발자였다. 이는 반복적이고 단순한 작업을 AI로 대체하기 위한 것으로 IT 기업들은 개발자에게 보다 전략적이고 고차원적인 업무를 요구하기 시작했다는 현실을 방증한다. 결국, AI로 인해 개발자의 역할은 더 이상 코드 ‘작성자’가 아니라 코드 ‘설계자’이자 ‘검토자’로 변화했다는 것을 알 수 있다.
품질 문제와 ‘조용한 실패’의 등장
지난 역사를 살펴보면, 누구나 프로그래밍을 할 수 있을 만큼 프로그래밍이 쉬워지는 순간마다, 프로그램의 품질이 낮아지는 문제가 반복됐다. 1970년대에는 C언어*와 컴파일러*의 확산으로 인해 미숙한 개발자 수가 급증했고, 유지 보수가 어려운 코드들이 쏟아졌다. 많은 코드가 시간이 지나며 ‘레거시*’가 된 것도 이 때문이다.
오늘날도 마찬가지다. 바이브 코딩과 AI 코딩 툴의 확산으로 인해, 검증되지 않은 코드의 누적과 품질 저하가 새로운 이슈로 떠오르고 있다. 특히 우려되는 것이 ‘조용한 품질 실패(Silent Quality Erosion)’다. 겉보기에는 잘 작동하는 것처럼 보이지만, 실제로는 내부적으로 테스트되지 않은 코드, 미사용 코드, 보안 취약한 코드가 누적되며, 시스템의 안정성과 신뢰성이 서서히 침식되는 현상이다.
실제 연구 결과에 따르면, MS의 AI 서비스 코파일럿(Copilot)이 생성한 파이썬 코드의 30%, 자바스크립 코드의 25%에서 이미 알려진 보안 취약점이 발견[참고링크]되기도 했다. 이에 따라 AI가 작성한 코드에 대한 검토·검증·리스크 관리 역량이 그 어느 때보다 중요해지고 있다.
* C언어: 1972년 벨 연구소의 데니스 리치가 개발한 프로그래밍 언어, 컴퓨터에 명령을 단계별로 알려주는 절차형 언어로, 메모리와 속도를 직접 제어할 수 있어 운영체제나 내장 시스템 개발에 주로 사용된다.
* 컴파일러(Compiler): 사람이 작성한 프로그램(소스 코드)을 컴퓨터가 직접 실행할 수 있는 기계어로 한 번에 전체 번역 해주는 소프트웨어, 실행 속도는 빠르지만 코드를 변경할 때마다 다시 진행해야 한다.
* 레거시(Legacy): 과거 핵심 역할을 했지만, 더 이상 활발히 개발되지 않고 테스트나 문서가 부족해 유지 보수가 어려워진 오래된 시스템 또는 코드 기반을 의미, 여전히 사용되더라도 오늘날 기술과의 통합·변환이 쉽지 않은 경우가 많다.
AI 기술보다 중요한 사람과 조직의 품질 책임
AI 품질의 중요성은 자율주행 사례에서 극명히 드러난다. 2023년 10월, 미국 자율주행 기업인 크루즈(Cruise)의 자율주행차는 샌프란시스코에서 보행자를 끌고 가는 사고를 일으켜 캘리포니아 주정부로부터 운행 허가를 취소당했다.
▲ 자율주행에서도 전체적인 시스템 품질이 매우 중요하다.
이는 보행자 충돌 판단 오류, 차량 하부 감지 기능 미흡, 반복된 유사 사고에도 개선이 부족했던 조직적 문제에서 비롯됐다. 반면, 또 다른 자율주행 기업인 웨이모(Waymo)는 철저한 테스트, 고도화된 센서, 규제 기관과의 협력, 보수적 확장 전략으로 인간 운전자보다 낮은 사고율을 기록하며 로보택시 서비스를 성공적으로 운영하고 있다.
이 두 사례는 AI 기술이나 성능 자체보다 시스템 전체의 품질이 성공을 좌우한다는 것을 보여준다. 알려진 리스크를 식별, 관리 및 완화하고, 지속적인 품질 관리 노력을 통해 신뢰를 구축하는 일 역시 사람의 몫이다.
“AI 시대, 새로운 학습 및 활용 방식 준비해야”
예전에는 주니어 개발자가 선배에게 일을 나눠 받고, 그 결과물을 피드백 받으며 학습하는 상향식 멘토링 모델이 일반적이었다. 그러나 AI의 도입은 이 학습 구조를 무너뜨렸다.
오늘날에는 선배 개발자도 AI를 활용해 더 많은 업무를 혼자 처리하며, 주니어에게 일을 나눠줄 여유가 사라졌다. 이에 따라 신입 개발자는 ‘일을 배우는 사람’이 아니라, ‘문제를 정의하고 스스로 해결하는 사람’이 되어야 한다. 즉, 하향식 문제 해결력과 AI 활용 능력이 동시에 요구된다.
실제, 최근 기업들의 상황을 보면, 신입을 거의 채용하지 않거나, 채용하더라도 AI 활용과 문제 정의 능력을 갖춘 고학력 인재 중심으로 바뀌면서, 실제로 조직 내 ‘막내 개발자’가 40대인 경우도 생기고 있다. 이는 단순한 인력 구성 변화가 아니라, 개발 조직의 고령화를 가져오는 동시에, AI 시대에 요구되는 인재상이 근본적으로 달라졌음을 보여준다.
▲ AI 시대, 개발자가 배우는 방식이 변화하고 있다.
이러한 예시에서 알 수 있듯, AI는 단순한 속도 향상을 넘어서, 개발 방식 자체를 구조적으로 바꾸고 있다. 빠른 프로토타이핑*, 탐색적 개발, 반복적 개선은 물론이고, 조직 구조와 학습 방식, 개발자의 역할까지 근본적으로 재편되고 있다.
특히 에이전트형 AI는 계획하고 실행하고 검토하는 자율형 자동화 시스템으로 발전하고 있다. 소프트웨어는 AI가 가장 먼저 깊이 침투한 분야이며, 이는 곧 산업 전반으로 확산될 가능성이 크다. 이러한 상황에서 인간 개발자의 가장 중요한 역할은 무엇을 만들지 정의하고, 왜 그렇게 해야 하는지를 판단하며, 그 결정에 책임을 지는 일이다.
이는 AI 시대에도 변하지 않는 인간 직업의 핵심 조건이기도 하다. 사람을 대해야 하는 일, 불확실한 상황에서 결정을 내려야 하는 일, 그리고 그 결정에 책임을 져야 하는 일은 여전히 인간의 몫이며, AI는 이러한 역할을 대신할 수 없다.
기술은 도구이며, 그 도구를 어떤 기준과 방향으로 사용할지를 정하는 것은 여전히 사람의 몫이다. AI 시대의 개발은 더 빠르고 창의적이며 책임감 있는 접근을 요구한다. 이제 우리는 기술의 수혜자에서 기술과 협력하는 설계자이자 조율자로 거듭나야 할 시점에 와 있다.
* 프로토타이핑(Prototyping): 소프트웨어를 본격적으로 개발하기 전에 동작하는 시제품(Prototype)을 먼저 만들어, 사용자의 의견을 받아 여러 차례 개선하며 완성도 높은 설계를 다져나가는 반복 기반 검증 방식
※ 본 칼럼은 AI/반도체에 관한 인사이트를 제공하는 외부 전문가 칼럼으로, SK하이닉스의 공식 입장과는 다를 수 있습니다.