우리는 하루에 250경 바이트에 이르는 데이터를 생산한다고 합니다. DVD로 저장해 쌓으면 지구에서 달까지 이르는 양인데요. 너무 방대한 양이다 보니 ‘빅데이터’라 부릅니다. 빅데이터는 기본적인 데이터화를 위해서이기도 하지만, 다음에 동일한 목표에 이르게 될 때 오류를 줄이고 효율을 높이기 위해서 수집되고 이용됩니다. 이는 단순히 컴퓨터에 국한된 이야기가 아닙니다. 우리가 하는 다양한 행동들이나 고정관념들이 데이터화 되어 재편된다면 질과 양이 달라질 수 있는데요. SK하이닉스도 Data Analytics 팀을 운영하며 데이터 분석을 통한 효율 극대화에 노력하고 있다고 합니다. 이 친근하지만 어려운 이야기, 한번 들어보실래요?
Q. 안녕하세요! 안대웅 팀장님, 이언 선임님. 만나 뵙게 되어 반갑습니다. 먼저 SK하이닉스 블로그 독자들께 소개 부탁드립니다.
안대웅 팀장 안녕하세요, SK하이닉스 블로그 독자 여러분! 저는 Data Science실 Data Analytics팀 안대웅 팀장입니다.
이언 선임 안녕하세요. 저는 Data Analytics팀의 이언 선임입니다.
Q. Data Analytics 팀은 어떤 업무를 하는 팀인가요?
안대웅 팀장 저희가 수행하는 업무는 크게 세 가지로 나눌 수 있습니다. 먼저 문제가 발생했을 때 분석을 통해 방법론을 제시하는 분석을 지원합니다. 두 번째로는 현장의 문제를 딥러닝이나 머신 러닝 등 방법에 적용하는 New ICT 업무를 맡고 있고요. 그리고 이렇게 만들어진 데이터를 기반으로 의사결정을 할 수 있도록 알고리즘을 개발하는 업무를 하고 있습니다.
Q. 흔히 통계는 데이터를 기준에 따라 수치로 다루는 것이라고 알고 있는데요. 여기에 분석을 지원하신다고 하셨습니다. 통계와 분석, 두 분야는 구체적으로 어떻게 다른 것인가요?
안대웅 팀장 분석을 통계와 비슷한 개념으로 생각할 수 있지만, 데이터를 바라보는 철학이 다릅니다. 통계는 비록 데이터양이 적더라도 분석해서 추론을 합니다. 반면 분석은 이미 너무 방대한 데이터가 있으므로, 그 속에서 원인을 찾고 분석 및 예측까지 하죠. 즉 통계는 가정을 세우는 것이 주를 이룬다면, 분석은 해결하는 것에 초점을 맞춘다고 할 수 있습니다.
이언 선임 팀 구성원들 중에는 통계를 전공한 분도 있고, 산업공학을 전공한 분도 있습니다. 각 분야의 장단점이 다르지만, 데이터를 오픈 된 마음으로 본다는 점은 같습니다. 데이터를 알고리즘화하는 과정에는 정답이 없기 때문에 데이터에 맞는 방법론을 찾는 것이 중요한데요. 이 과정에서 통계의 방법론이든, 분석의 방법론이든 모두 사용되고 있습니다.
안대웅 팀장 그래서 채용을 할 때도 ‘Data Analyst’라는 직무로 통계학과, 산업공학과 등 전공을 한정 짓지 않고 폭넓은 지원을 받고 있습니다. 저희는 개발, 생산, HR의 데이터까지 다루기 때문에 어느 한 분야에 국한된 시선을 갖지 않도록 노력하고 있습니다.
Q. 반도체 기업인 SK하이닉스가 Data Analytics를 필요로 하는 이유는 무엇인가요?
안대웅 팀장 효율성 때문입니다. 정확한 분석을 한 알고리즘을 현장에 적용한다면 오류를 줄일 수 있고, 불필요한 업무도 줄일 수 있습니다. 경비 절감은 물론 생산력을 높이는 데 기여를 할 수 있죠. 예를 들어 불량이 100개중 한 개라면, 이를 십만 개 중 한 개로 줄일 수 있는 것이 바로 이 분석을 통해서 입니다.
이언 선임 우리가 달리기를 할 때도 옷, 신발, 날씨 등을 고려하면 시간을 단축할 수 있잖아요. ‘사람’이라는 변수가 최소화된 반도체 생산의 경우, 정확히 분석하고 적용한다면 그 효율을 배가 될 것입니다. 공정도 다양하기 때문에 적용 범위가 무궁무진한 것도 있고요. 이처럼 Data Analytics팀은 반도체를 개발하고 생산하는 데 더욱 효율을 높일 수 있도록 현업 부서를 서포트하는 역할을 하고 있습니다.
Q. Data Analytics 팀의 일하는 방식이 궁금합니다.
안대웅 팀장 업무 과제를 현업에서 받는 경우도 있고, 저희가 발굴하는 경우도 있습니다. Raw data를 받아서 분석을 하는데, 정리되지 않은 ‘방대함’ 그 자체이죠. 데이터를 정리하고 분석해 알고리즘화 한 다음, 현장에 적용할 수 있게 애플리케이션까지 만드는 업무를 하고 있습니다.
이언 선임 분석 툴이 다양하고, 각자의 경험도 다르기 때문에 정해진 업무 방식은 없습니다. 에게 업무를 맡기고도 ‘네 생각이 그러니? 그럼 그렇게 해봐’ 하며 믿어주며 업무를 하고 있습니다. 굉장히 민주적이며 수평적이라고 할 수 있죠.
저희 팀 구성원은 학사: 석사: 박사의 비율이 1: 1: 1입니다. 학력의 차이는 있지만 저처럼 반도체 개발 업무를 하다 온 팀원도 있고, 공부만 하다 온 팀원도 있죠. 앞서 말했듯 정해진 정답은 없기에 각자의 경험과 생각을 공유하는 것이 중요합니다. 그렇기 때문에 팀 분위기가 수평적일 수밖에 없는 것 같아요.
Q. 그렇다면 팀원들은 반도체와 분석, 두 가지 분야 모두 전문가이신가요?
안대웅 팀장 저는 대학에서 전자공학을 전공했고, 제품개발부에서 근무했습니다. 그 후 대학원에 들어가서 데이터마이닝을 전공했고요. 저희 구성원들을 보면 저처럼 현장 근무를 했던 분도 있고, 현장 경험이 없는 분도 있습니다.
이언 선임 저 같은 경우는 데이터분석이 전공인데요. 대학원에서는 자동차 관련 데이터를 주로 다뤘습니다. 이후 컨설팅 경험이 있지만 반도체 분야는 아니었죠. 반도체에 대해 잘 모르기 때문에 지금도 공부를 하고 있는데요. 다양한 경험을 갖고 있기 때문에 업무를 바라볼 때에도 고정관념이 없어 좋은 것 같습니다. 데이터는 살아있는 생물 같기에 한쪽으로만 바라보면 안 되거든요.
Q. 데이터분석 전문가로 일하시면서 어려운 점이 있다면요?
안대웅 팀장 아무래도 반도체 생산에 직접적인 영향을 미치는 업무가 아니기 때문에, 현장에 계신 분들이 중요하게 생각을 안 할 때가 있습니다. 현장 경험이 많고 하신 분들은 기존의 방식을 바꾸면서 새로운 분석이나 애플리케이션을 활용을 굳이 하지 않으려고 하죠. 충분히 이해하기에 강요할 수 없지만 아쉽긴 하죠.
Q. 반대로 뿌듯함을 느꼈던 적은 없으신가요?
안대웅 팀장 아직 저희 업무는 전사적인 지원이 필요한 상황이어서 업무의 중요성을 믿어주는 임원진들이 계시는 것은 큰 힘이 됩니다. 그리고 저희 분석을 통해 불량률이 낮아진다거나, 시간이 단축되었다는 결과가 나오면 결과도, 예측이 맞았다는 것에 뿌듯함을 느낍니다. 또 반대로 결과가 안 좋아도 또 다른 데이터가 생산되는 것이기에 다른 해결점을 찾기 위한 기대감이 크고요.
데이터분석 업무는 방대한 데이터 내에서 의미 있는 데이터를 추출해 내는 일입니다. 예를 들어 이전에는 ‘1+1=2’ 이라는 수식이 있다고 한다면 +(더하기)의 의미를 모두 알잖아요. 하지만 이 데이터분석이라는 분야는 1과 1 에서 2가 나왔을 때 그 중간의 수식을 만들어 내는 일을 합니다. 사실 이 수식이 수 만가지가 나오게 되는데요. 그 업무에 적절한 수식을 찾아 적용했을 때 느껴지는 희열이 있습니다.
Q. 두 분은 평소에 어떤 뉴스를 눈여겨보시나요?
안대웅 팀장 데이터 분야는 매일 매시간 새로운 뉴스가 쏟아지고 있습니다. 공부를 게을리할 수 없죠. 머신 러닝, 딥러닝 등 데이터를 다루는 뉴스에 촉각을 세울 수밖에 없습니다.
이언 선임 저는 반도체 개발 경험이 없기에 반도체에 대한 뉴스를 빼놓지 않습니다. 그리고 회사 내 스마트쿠키를 통해 공부를 하기도 하고, 프로젝트를 받을 때마다 현장을 이해하고 배우려고 노력합니다. 학교 다닐 때보다 공부를 더 열심히 하고 있어요. (웃음) 또, 전공 분야가 아닌 새로운 형태의 데이터에 대해 관심을 갖고 공부하고 있습니다.
Q. 두 분이 보시는 반도체 분야 Data Analytics의 미래는 어떤 가요?
안대웅 팀장 알파고는 개발자가 30대에 개발한 사실을 아시나요? 아이폰의 안면인식도 딥마인드이고요. 데이터를 데이터로 바라보는 시대는 지났습니다. 이 분야는 아직 젊고 데이터는 무한합니다. 반도체 분야에서도 마찬가지입니다. 사람의 경험과 노력이 들어갔던 부분들에 이러한 기술이 적용되면, 그 에너지를 다른 창의적인 곳에 쏟을 수 있어요. 그렇기 때문에 반도체는 무궁무진하게 발전할 수 있을 것입니다.
이언 선임 데이터라는 것은 옛날부터 존재했지만 중요하게 여겨지지 않았습니다. 지금의 통계학 이론들이 100년전에 나왔다는 것만 봐도 그간 큰 변화가 없다는 것을 알 수 있죠. 그만큼 분석의 필요성도 느끼지 않았을 테고요. 하지만 눈을 뜨면 새로운 뉴스가 쏟아지는 요즘, 이 데이터분석 분야는 이제 겨우 시작이라고 생각합니다. 굉장하다고 여겨지는 알파고 조차 사실 일부의 기술만 적용된 것이니까요. Analytics라는 분야가 가진 가능성은 우리가 생산하는 데이터의 양만큼 방대하지 않을까요?
Q. 반도체 분야의 Data Analytics 전문가가 되고 싶다면 어떤 준비를 해야 할까요?
이언 선임 기본적으로 데이터마이닝과 Language 소양이 있어야 합니다. 데이터에 따라 필요한 분석 기법이나 표현 언어가 다르기 때문에 통계부터 머신러닝, 딥러닝, R, Python, SQL, C#, JAVA 등 분야를 막론하고 필요로 하죠. 또한, 이라 할지라도 ownership을 갖고 프로젝트를 맡아야 하기 때문에 스스로 성장할 수 있는 도전정신이 필요합니다.
Q. Data Analytics 팀의 앞으로의 목표가 있다면요?
안대웅 팀장 저희는 팀이 만들어진 이후 약 140여개의 프로젝트를 수행했습니다. 기간에 비해 많은 수인데요. 아직은 업무 적용성에 대한 우려로 단기간에 성과가 보여지는 Quick Win 프로젝트 위주로 진행하였습니다. 지금까지 저희 팀의 홍보 단계였다면, 이제부터는 더 큰 프로젝트를 진행해보려고 합니다.
Q. 마지막으로 미래의 SK하이닉스 Data Analyst가 될 청년들에게 한마디 부탁드립니다.
안대웅 팀장 주변에서 ‘알파고가 세상을 지배하면 어떡하지?’ ‘기계 때문에 내 직업이 없어지는 것 아니야?’라는 걱정을 농담 삼아 하십니다. 하지만 ‘알파고를 만드는 사람이 된다면?’으로 바꾸어보면 답이 있습니다. 우리 Data Analytics팀은 데이터를 분석만 하는 팀인 것 같지만, 알파고를 만들 수 있다는 자신감을 가진 창의적이고 적극적인 팀입니다. SK그룹의 경영철학이 딥체인지인 만큼, 모든 것을 바꿀 수 있는 마인드를 가지시길 바랍니다. 그리고, 주저하지 말고 도전해주세요!
지금까지 Data Analytics 팀과 만나 데이터분석 분야에 대한 다양한 이야기를 들어보았는데요. 두꺼운 안경을 끼고 탁상공론만 할 것 같던 선입견은 어느새 사라지고, 카페인 20,000% 에너지음료 같은 느낌이 들었습니다. 앞으로 이분들이 만들어내는 분석들이 SK하이닉스를 넘어 세상을 어떻게 바꿀지 기대가 됩니다. SK하이닉스 표 알파고를 기대해 보아도 좋겠죠?