데이터 컨설팅 요청을 받는 경우가 있다. 단순하게 주가 예측하는 알고리즘 만들어달라거나, 비트코인 가격 맞출 수 있게 해달라거나 하는 둥의 황당한 요청이야 단번에 거절하는데, 때때로 최소한 말은 되는 데이터 사이언스 급의 프로젝트를 들고 오시면 일단 답변은 드린다. 근데, 다들 생각하시는게 무슨 개발 프로젝트 발주하는 마인드인 것 같아서 황당할 때가 많다.

얼마전에 Android 개발자 포지션에 지원하신 분의 메일 내용 일부가 이 글의 주제와 맞닿아 있는 것 같아서 살짝 소개만 해 본다.

인공지능 회사에 안드로이드 개발자로 입사…. 개발한 어플을 홍보할 마케팅 비용이 없다는 이유로 정부 프로젝트를 회사에서 진행…. 인공지능 키워드로 홍보를 하는 회사인 만큼 인공지능 기능이 들어간 정부 프로젝트에 참여하게 되었는데, 해당 프로젝트에 참여하게 되면서 문제가 발생하게 됩니다.

평소에 수학적인 기반 지식이나 인공지능 및 데이터 관련 기반 지식이 전혀 없던 저는 해당 업무는 저의 업무가 아니며, 내가 맡을 경우 결과가 좋지 않을 것이다라고 강하게 어필하였으며 연구인력이 필요하다고…. 실제로 회사에 있는 연구 인력이나 데이터 사이언티스트는 너 개발자인데 왜 못해라는 분위기로 억지로 저에게 일을 떠넘겼고….

내가 무능하고 잘못생각한건가라고 헷갈리기 시작했습니다… 뭔지도 모르는 수식들을 봐가며 이해하기를 시도하다 포기하고 코드들을 단순히 복붙하였고… 그림찾기 수준으로 같은 데이터만 수집하는 매크로를 작성하여 데이터 셋을 가공했고…. 결과가 왜 그렇게 나오는지 알지도 못한채, 내가 학습하는 알고리즘이 무슨 알고리즘인지도 알지도 못한채….

블로그의 글을 (중략) 이런 분이 운영하는 회사에서 업무를 하게 된다면 적어도 내가하는 안드로이드 개발 업무 외에 다른 업무를 말도 안 되는 이유도 맡게될 이유는 없겠구나는 생각…. (중략)

매일같이 보고 듣고, 가끔은 매우 가까이서 보고 듣게 되는 현실이다. 경력 3년차 안드로이드 앱 개발자에게 저런걸 시켜서 정부 프로젝트라는 허명아래 세금 낭비를 하고 있는데, 내 입장에서는 안타까울 뿐이다.

저런 프로젝트들만 보고 연락을 주셔서 그런지는 모르겠는데, 데이터 컨설팅 요청을 하는 사람들에게서 대화가 안 된다는 느낌을 강하게 받은 에피소드 몇 개만 소개한다.

 

모 게임사 Case – 개발자 한 명이랑 너랑 하면 되는거 아냐?

어느 중견 게임사, 아마 게임 업계 계신 분들이면 이름 듣고 아~ 정도가 나올만한 회사의 서울 지사장이라는 분이 연락을 주셨다. 자기네 특정 서비스가 인간이 풀어낼 수 있는 건지 아닌지, 꼼수로 풀어낼 수 있는건지 아닌지를 알아낼 수 있는 “인공지능” 알고리즘을 만들 수 있냐고 하시더라.

몇 차례 메일을 주고 받은 끝에, Reinforcement learning을 시켜야하고, 시뮬레이션 기반으로 Model-Free (속칭 Q-learning)으로 모델을 만들어야한다는 사실을 깨달았다. 거기다, 게임 중에 랜덤으로 추가되는 변수들이 스테이지 별로 점점 더 많아지는 구조라 더더욱 알고리즘 개발에 시간이 많이 걸린다고 알려드렸다. 저런 랜덤 요소들을 무작정 변수들로 추가하기 시작하면 시뮬레이션으로 모든 Grid를 다 찾아야하기 때문에 Learning 작업이 아예 안 끝날테니, 뭔가 합리적인 규칙을 이용해서 랜덤 변수들을 최소화할 수 있는 조건식을 찾아봐야할 것 같다고 수학적인 설명을 해 줬다. (당연히 못 알아들었을 것이다.)

그 서울 지사장이라는 분은 자기네 회사에 병특으로 와 있는 K모 대학 출신 개발자가 매우 똑똑한 인재니까 필자에게서 저런 “수학 모델링” 작업을 훔쳐(?) 배우면 몇 달안에 저런 “인공지능 알고리즘”이 뚝딱~ 개발이 될 것이라고 생각하고 있으시더라.

이건 Bellman equation으로 모델을 만들어서 손으로 풀 수 있는 부분 (Analytic solution)이 최대한 많아지도록 모델을 설계해야한다고, 필자와 비슷한 수준으로 Bellman equation에서 2개, 3개 이상의 random state variable이 있는 경우를 풀어본 경험이 있는 사람이 몇 명 붙어서 이런저런 고민을 길게해야한다고 설명을 해 줬는데, 정말 전혀 못 알아 듣는 표정이더라. (사실 여기서 대화를 접었어야 했다.)

끝까지 자기네 개발자를 투입시키면 비용이 절감될텐데 왜 다른 박사를 불러올려고 하느냐면서 말을 잡아 끌다가, 나중에는 다른 수학과 교수들과 연락하고 있다는 식으로 가격 협상을 하려고 하셨다. 외람되지만 수학과 교수님들 중에 Bellman equation 으로 모델 만들고, 그 때 state variable이 너무 많다는 이유로 손으로 푸는 대신 컴퓨터의 Trial-and-error 방식으로 문제를 풀어보신 분은 아마도… 없을 것이다. 물리학 하시는 분들이나 기계공학 하시는 분들이 비슷한 작업을 하시는걸 본 기억은 난다. (그런 수학 방법론을 쓰셨다는 이야기지 머신러닝에 활용했다는 이야기 하는건 아니다.)

나중엔 Proto-type을 만드는 견적을 달라고 하시던데, 이건 뭐, 저런 연구과제가 어떻게 돌아가야되는지 전혀 모르는 분이나 하는 질문이 아닐까? 금액을 불렀더니 아예 답장도 안 주더라. 답장도 안 하는 정도의 무례한 사람에게 왜 내가 시간 낭비를 했을까?

 

모 의학 스타트업 Case – 사업 아이디어를 전부 만들어주세요

어느 의학 스타트업에서 생체데이터와 자기들 내부 데이터를 “분석”하여 모델 구축 후 (“분석”이라는 단어를 쓴 것부터 이미 이 블로그를 대충 봤다는 티가 났었다), 그 데이터를 리얼타임으로 “분석”하면서 의사결정을 예측하는 앱을 개발하고 싶단다. 그러면서 마지막에 앱 만드는 부분만 자기가 할테니 앞 부분을 다 만들 수 있냐, 가격은 얼마냐는 질문을 받았다.

그 스타트업 관계자의 익명성을 위해서 구체적으로 무슨 데이터였는지에 대한 정보는 생략한다.

이 회사의 홈페이지를 들어가면 딱 저 사업 모델로 “혁신”을 갖고 온다고 써 놨다. 설립일이 2018년 2월로 되어 있고, 약 30억 정도의 투자금을 받았던데, 위의 요구사항 메일을 봤을 때 1년동안 저걸 시도해보다가 내부적으로 실패하고 “실력자(?)”로 짐작되는 사람에게 외주를 주는 방식으로 해결하려고 한다는 사실을 감 잡을 수 있다. (관계자님, 제 짐작이 틀렸다면 사과드립니다.)

완전히 남의 사업 모델을 하나 다 만들어달라는 급의 요구를 하는데, 의학 데이터는 필자가 잘 모르는 분야이기도 하고, Pabii 사업이 바빠 시간을 쓰고 싶진 않았지만 그래도 돈 없는 스타트업 입장에서 직원 분들 월급도 주고, 설비도 들여놓고, 외부 마케팅 비용도 벌어야되니 돈만 많이 주면 해 주겠다고 크게 양보를 했다.

사업 모델을 들어봤을 때, 그들이 말하는 데이터가 리서치 할 수 있는 수준으로 이미 확보되어 있다는 전제아래, 1단계 모델링 작업, 2단계 실시간 처리용 개발작업, 3단계 앱 개발 작업으로 나뉜다고 말씀드렸더니, 그럼 (돈 좀 아끼고 싶으니까) 1단계만 부탁하고 싶단다. 근데 실시간 처리용 개발하려면 서버에 저 모델을 어떻게 얹어야하고, DB는 어떻게 설계해야하는지 계속 저랑 커뮤니케이션해야될텐데요? 그건 공짜로???

우리 Pabii의 DSP 사업 모델만해도 최소 10억 이상의 초기 투자금이 필요한 서비스다. 그 사이에 이것저것 돈 들어갈 일이 많고, 솔직히 말해서 10억원도 턱없이 부족하다고 생각한다. 그나마 다행인 부분은 연구, 개발 분야에 외주 줄 필요가 없을만큼의 인력이 모여있기 때문에 “도전” 부분에서는 비용이 절감(?)될 뿐이다.

반면, 저 의학 스타트업은 자기네의 핵심 모델을 개발하는 작업을 완전히 외주줘야할만큼 연구 수준이 낮은, 말 그대로 “이빨로 투자받은” 상태인데, 이런 외주에는 얼마를 쓰는게 맞을까?

필자가 같은 상황이었으면 아예 창업을 하지 않았거나, 아무리 많은 돈이 필요해도 저런 모델링을 할 수 있는 데이터 사이언티스트 찾아 삼만리를 했을 것이다.

필자가 잠깐 겪었던 미국의 어느 스타트업은 이름만 파이낸스 박사지 사실 세부 전공은 아무 관련이 없는 교수 하나를 감사로 임명하고, 통계학 석사 출신 중국인 하나에게 특정 모델을 만들라고 시켰다가 그 중국인이 탈출하고 필자를 뽑았었다. 면접 숙제라고 나오는 내용들이 모조리 경쟁사 모델 replication인데 가이드가 너무 없어서 이상하다고 생각했다가, 회사 들어가자마자 이 사람들이 모델도 없고, 나한테 모델 만들라고 할꺼면서 지분을 0.0x%만 주려는 무개념 욕심꾸러기라는 사실을 깨닫고 탈출했었다. (그리고 그 회사는 얼마전 투자금을 다 소진하고 청산 절차를 밟았더라.)

앱 하나 만들면서 몇가지 알려진 기능을 구현해달라고 개발자를 찾는 것도 아니고, Seed에 30억이 넘는 투자금액이 들어오는 “상상속의 도전”을 시도하는 회사가 자기네 연구 능력 부족으로 외주를 주게되면 얼마를 써야할지 지금도 잘 모르겠다. 모르긴 몰라도 전세계에 당신들이 원하는대로 연구 결과물을 뽑아낼 수 있는 사람이 몇 명 없을 것이다.

 

어느 대기업(들) – 데이터 사이언티스트 있는 스타트업 하나 인수하면 되는거 아냐?

최소 2개의 국내 대기업들에서 만났던 편견이다. 데이터 사이언티스트라고 뽑은 인력들이 사실은 Data Engineer거나, Data Analyst라고 냉정하게 평가해줬더니, 그럼 데이터 사이언스 프로젝트 외주 주지말고 아예 Data Scientist 있는 스타트업 하나 인수하면 되는거 아니냐는 식으로 전략을 바꾸더라.

처음 겪었던 대기업 1번은 학부생들이 우리 페X스북에서 인턴해봤던 데이터 사이언티스트에요~ 라고 팀 만들어놓은 걸 보고, “Acqui-hire” (인재 고용을 위해서 신생 스타트업 팀을 통째로 인수하는 것)를 시도하고 있더라. 당시 그 분들이 옵션 중 하나로 뒀던 중형급 스타트업은 핵심 사업 모델을 모 대학교에 있는 어느 교수한테 외주를 주고 있는데, 그 교수는 그쪽 시장이 어떻게 움직이는지에 대해서 굉장히 얊은 이해를 가진 분이었고, Acqui-hire 하려고 했던 그 학부생 스타트업은 학부 수준 통계학을 이것저것 적용해본 걸로 블로깅하는 기초 수준이었다. 더불어 고민하셨던 투자 옵션이 관련 비지니스를 몇 달동안해서 이것저것 개발해봤다는 초짜 개발자들 스타트업에 지분 투자하는 거였던걸로 기억한다.

참고로 관련 비지니스를 몇 달동안 해 봤다는 그 스타트업은 비지니스 모델이 제대로 안 돌아가니 국내 유명 K대학 학부생 동아리!!!!! 애들과 업무 협조를 해서 “인터넷으로 배운” 비지니스 모델을 구현하겠다고 시도하고 있었다. (후에 관계자에게 뒷 이야길 들어보면 동아리!!!!!와는 결별했고, 인터넷으로 배운 탓에 Client쪽 서비스를 어떻게 만들어야하는지를 모른채 2년을 허비했단다. 연구 프로젝트를 인터넷으로 배우고, 학부 동아리!!!!! 와 업무 협조로 풀어낸다고??? 도대체 어떤 전공이 이런 수준으로 연구를 하나??)

대기업 2번은 인력 채용이 힘들다고 실리콘밸리까지가서 소형 스타트업 하나를 인수했다. 그 스타트업이 뭔가 데이터가 엄청나게 많은 것처럼 주장하고, 사업 모델이 빵빵한 것처럼 이야기했지만, 정작 제대로 된 데이터 사이언티스트 하나 없이 엔지니어들이 글 첫머리의 안드로이드 개발자 사례처럼 이것저것 주워붙이기 하던 상황이었고, 그나마 좀 똘똘했던 중국인 데이터 사이언티스트는 인수된 후 얼마 지나지 않아 다른 회사로 이직해버렸다고 하더라. 결국 데이터 사이언티스트 하나 없는 쭉쩡이 스타트업을 인수한 꼴이 됐다.

저 위의 2개 대기업은 모두 오너 레벨에서 데이터 인력을 키워야한다고 목소리를 높이고, 외부 인재를 열심히 영입하고 있는걸로 유명한 회사들이다. 그런데, 이렇게 말해서 정말 미안하지만 필자가 보기에 저정도면 잘하겠다 싶은 데이터 사이언티스트 뽑은 걸 아직 못 봤다.

 

나가며 – 개발? 연구!!

1년 반쯤 전에, 데이터 컨설팅 회사에 재직 중이라는 통계학과 졸업생을 만난적이 있다. 자기네 회사에 통계학 교수와 공학 교수가 Co-founder이기 때문에 믿고 왔는데, 정작 회사에는 공대 분들이 통계학적으로 틀린 작업들을 코드 복붙해서 하고 있고, 교수님들은 이해를 못하는건지 관심이 없는건지, 이름 값으로 프로젝트 따는데만 관심이 있는건지, 결과물은 그냥 그 상태로 고객사에 전달되고 있단다. 자기는 아무 말도 못하고 따라만 가고 있을 수 밖에 없는 사실이 너무 괴롭다며 불평을 했었다.

아마 필자를 찾아왔던 저 위의 회사들 중 상당수가 필자가 부른 “견적”에 깜놀!하고 그 통계학과 졸업생 분이 계신 데이터 컨설팅 회사 수준의 인력에게 외주 프로젝트를 맡기고 있을 것이다. 그리고 결과물이 마음에 안 들면 데이터 사이언스라는거 그거 별거 없는거라고 불평불만을 털어놓으시겠지.

직장 초년병 시절에 있었던 외국계 증권사의 IBD팀은 M&A건당 엄청난 금액의 수수료를 요구했었고, 당시 필자와 비슷한 인력 풀의 친구들이 들어갈려고 갈망했던 외국계 전략 컨설팅 회사들도 파트너 급들이 국내 대기업들에게 깜놀!!할 자문료를 요구했던 기억이 생생하다. 인턴도 한 두달 훈련만 시키면 했던 수준의 외국계 증권사 업무나 전략 컨설팅 업무도 아니고, 그들보다 훨씬 더 Academic challenge의 레벨이 높고, 단순한 “직장 경력”만으로는 명함도 못 내미는 연구 프로젝트들을 외주로 맡기려고 하면서, 심지어 자기들은 퀄리티의 차이도 잘 인지 못하면서, 왜들 저렇게 푼돈으로 해결하려고 하는걸까?

푼돈으로 외주 주려다가 피본 사례 중 IT업계 예시가 아닌, 실제 눈으로 보고 겪은 사례 하나만 여담으로 공유한다. 2008년, D모 외국계 증권사 IBD 막내 시절, 지방의 어느 백화점 업체가 매물로 나온 모 화장품 업체 인수전에 뛰어들겠다고 당시 재직 회사를 찾아왔었다. 시장에서 예상했던 딜 사이즈가 대략 3천~4천억 정도였는데, 그에 맞춰 우리 수임료를 불러주니 놀란 황소 눈이 되었던 그 회사 담당자의 눈이 아직도 선하다. 결국 무늬만 IB고 자금 지원 능력이나 딜리버리 능력이 전혀 없는 어느 국내 증권사를 선임해서 인수전에 뛰어들었던 게 기억난다. 당시 인수 후보가 많았던 탓에 1차, 2차 라운드로 인수 후보들을 걸렀는데, 첫 라운드에 떨어져 나가더라. (담당자들의 뒷 이야기를 들어보면 아예 서류조차 제대로 읽지 않았던 후보란다.) 당시에 윗 분들이 “우리랑 팀을 짜도 힘들었을텐데 겨우 국내 증권사 써서 되겠냐 쯧쯧”이라고 혀를 찼었다. 그로부터 3년도 지나지 않아 서울의 대형 백화점들이 지방 상권을 싹 장악하면서 그 지방 백화점은 몰락의 길을 걸었다. 당시에 회사의 생존을 위해서 사생결단을 내렸어야했던 타이밍인데, 겨우(?) 몇 십억의 수임료를 아끼려다가 지방 유지 3대가 평생을 바쳐 일궜던 사업체는 백발과 주름살에만 흔적이 남은 회사가 되어 버렸다.

한국의 Software Engineering 관련 비지니스 대부분이 건설업의 그것처럼 하청, 하청의 하청 같은 방식으로 운영되는걸 자주 듣는다. 근데, 위에 예시를 든 Data Science 프로젝트 대부분이 개발 인력 몇 명으로 해결되는게 아니라, 똑똑이들 잔뜩 모아놓은 스타트업들의 운명을 걸고 해야하는 수준의 대형 연구 과제급 사업모델이라는 걸 인지하고나도 여전히 개발 외주 주듯이 후려치기를 할까? 아예 몇 백억을 주고 Acqui-hire를 해도 핵심 인력인 Data Scientist가 이직해버리는 판국인데?

전관 예우를 받는 변호사를 고용하고, Track record가 엄청난 외국계 증권사를 고용할 때, 그 때 만나던 지적 능력과 희소성을 갖춘 인력들에게 외주를 줘야한다는 사실, 당신이 원하는걸 해 줄 수 있는 사람이 거의 없다는 사실을 좀 인지하고 외주 프로젝트 이야기를 꺼냈으면 좋겠다.

“몇 천만원 정도 쓰면 되나요?”라는 (모욕적인) 질문은 그만 받았으면 한다.

 


공지: 2019년 3월 29일을 끝으로 데이터 사이언스 주제의 포스팅은 종료됩니다. 이 후에는 파비의 스타트업 운영 관계된 포스팅만 월 1회 작성됩니다.

Leave a Reply

Your email address will not be published. Required fields are marked *