현재 테지스는 비트렉스, 크라켄 또는 폴로닉스에서 거래를 허용하고 있지 않습니다. 따라서, 테조스
시리즈 가이드
 상에 명시되어 있듯이 2017년 12월 29일부로 만기되는 비트멕스의 테조스 / 비트코인
선물계약 (XTZZ17)은 ICO 가격 0.0002 XBT로 정산 될 예정입니다.

비트멕스는 사용자를 대신하여 보유하고 있던 모든 비트코인 캐시 (BCH) 판매를 완료했습니다.
비트코인 캐시 판매 관련 세부내역은 아래와 같습니다:

  • 각각의 사용자가 보유할 자격이 있는 비트코인 캐시는 2017년 8월 1일 13:17 (UTC) 기준의 사용자 별 마진 잔고 (Margin Balance)에 의해 결정되며, 이는 478,588번째 블록 생성 이후
    몇 초의 시간대에 결정됩니다.
  • 비트코인 캐시 (BCH)와 비트코인 (XBT) 비율: 1 BCH : 0.1707 XBT
  • 사용자들의 비트코인 지갑은 개별 사용자의 비트코인 보유 자격 수량만큼 채워집니다.

보험기금은 비트코인 캐시 보유량으로 인해, 120.5321631 XBT 만큼 공제되었습니다.

경제학에는 “매몰비용 (Sunk Cost)”라는 개념이 있다. 고가의 영화 티켓을 끊고 들어갔는데, 정작 영화가 너무 재미없다면? 돈이 아까워서 영화관에 죽치고 앉아 있는 것보다, 맘을 비우고 나와서 다른 재밌는 활동을 찾는편이 더 나음에도 불구하고, 사람들이 “본전”생각이 나서 꾹 참고 있는 상황을 설명하는데 가장 적합한 개념이 아닐까 싶다.

광고 비용은 경제학에서 말하는 대표적인 매몰비용이다. 중간에 중단하고 원금 회수가 불가능하기 때문이다. 원금을 회수하는 유일한 경우는 상품 홍보가 되어서 상품이 팔릴 때 뿐이다. 그럼 효용은 있나? 사용자에게 상품을 홍보하는데 활용되지만, 그래서 “사고 싶다”는 욕구가 들도록 만들지만, 정작 그 상품의 가치를 제대로 누리는데는 큰 도움이 안 된다. 광고주 입장에서는 투자(?) 비용이 오직 홍보 효과만 있고, 정작 상품이 팔리지 않으면 그 비용을 회수할 수 있는 방법이 없다. 뼛속까지 경제학도인 필자는 마케팅이란 그 홍보 효과를 얻기 위해서 단단한 논리로 모델을 만드는게 아니라, 사람들을 유혹하는 몇 가지 캐치 프레이즈와 화려한 시각디자인이 중심인, 말 그대로 피상적인 인간을 유혹하는 피상적인 비지니스라고 생각했었다. 진중하고 무거운 인간인 척하는 필자에게 어지간한 일회성 광고가 먹힐리 없다. 이런 사고 방식을 갖고 대학 시절부터 마케팅이라는 전공을 폄하, 무시했다. (얼치기 경제학도의 어줍잖은 아집과 편견임을 인정한다 ㅋㅋ)

무시할 수 있었던 또 다른 (더 어줍잖은) 근거는 마케팅이라는 대학 전공이 기술적인 말장난에 불과해 보였기 때문이다. 학부 2학년 시절에 딱 한 시간 친구따라 청강하러 갔던 경영학과 마케팅 수업에서 “베블런 효과 (Veblen goods – 과시를 위한 사치재 수요)”를 자기들 마음대로 다른 이름으로 바꿔서 고가 제품에 대한 수요가 많다는 “썰”에 “이론”이라는 단어를 붙이는 걸 보고,” 저게 무슨 대학 전공 수업이냐, 교양 강좌지.”라고 생각한 이후로, 십수년동안 마케팅이라는 단어에 대한 매우 심한 편견에 빠져있었다. (경제과 출신이 경영”학(?)”과 “디스”할 때 흔히 쓰는 레퍼토리다 ㅋㅋ)

 

1. 광고의 효과 – “Waste of Money”

박사 학위 중에 연구실 옆자리에 있던 마케팅 전공 친구를 처음 만났을 때도, “그냥 ‘썰’ 잘 푸는 전공”일 것이라고 지레 짐작하고 “무시”하고 있었다. (대신 수학, 물리학과 출신 앞에서는 “쫀다”) 그러던 어느날, 2개 분포 함수가 서로 correlation이 있는 경우를 도식화하기 위해서 Copula 라는 걸 그리고 있었는데 (필자의 박사 연구 주제는 여러 자산의 가격이 동시에 폭락할 때 시장에 spiral effect를 준다는 아이디어에서 출발한다), 필자가 쓰고 있던 코드보다 더 좋은 코드를 쉐어해주는걸 보고 적잖이 당황했었다. 이 친구는 알리바바의 유저 데이터를 이용해서 이른바 “퀀트 마케팅 (Quant Marketing)”을 하고 있었는데, 필자와 비슷한 수학과 통계학을 단지 “다른 주제”에 적용하고 있다는 걸 나중에서야 알게되고 그동안 “무시”했던걸 사과한다고 고개를 숙였던 적이 있다.

수학적인 깊이에 대한 “무시”가 없어졌기는 했지만, 여전히 광고의 효과에 대해서는 비관적이었다. 당장 온라인에서 보는 배너 광고에 필자가 클릭한 기억이 없고, 평소에 누군가가 나눠주는 유인물에 관심을 가진적이 한번이라도 있었나 생각해보니 역시 긍정적인 답이 안 나온다. 선거철에 집에 유인물이 도착하면, 우편함을 나오자마자 거의 바로 쓰레기 통에 직행한다. (민주 시민의 자질이 부족한 것 같다…) 어린 시절에는 경제 신문을 읽으며 “트렌드”를 따라간다고 생각했는데, 요즘은 그 모든 기사가 “광고”라는 의도를 숨긴채 그럴듯하게 포장된 활자의 전달이라는 생각이 들어서 읽기가 거북하다. 필자가 좀 더 비딱한 사람이라는 걸 인정하지만, 그렇다고 “너 말고 다른 분들은 광고에 민감하게 반응할꺼”라고 주장하실 수 있는 분도 없을 것이다.

실제로 대부분의 광고는 “Waste of Money”다. 국내에서 제일 비싼 온라인 광고 지면도 클릭율 (Click Through Rate, CTR)이 0.1% 남짓이고, CTR이 높은 광고들은 인간의 육체적인 욕구를 자극하는 광고들이 대부분이다. 광고는 Right Time, Right Place, Right People 에게 해야한다는 이야기들을 많이 듣는데, 그걸 어떻게 알 수 있을까? 고속도로 변에 달린 대형 옥외 광고판에 있던 어느 광고는 정말 Right, Right, Right일까? 아니면 Wrong, Wrong, Wrong 일까?

 

 

2. 광고의 효과 – How not to “Waste Money”?

요즘들어 “빅데이터”를 이용해 Right People을 찾아낸다는 광고 매체들이 많이 생겼다. 위는 며칠간 필자가 그런 광고에 돈을 쓰고 난 다음에 Google Analytics로 정리한 유저 스탯이다. 65%에 육박하는 유저들이 단순하게 Google 검색을 해서 필자의 페이지에 들어왔고, 16%의 유저들은 그냥 필자의 웹페이지를 검색창에 쳐서 들어왔다. 국내 포털 1위 업체인 Naver에서 검색으로 유입된 유저의 비율은 4%에 불과하고, 필자의 블로그 글 링크를 공유한 (의도치 않은) 바이럴 마케팅을 제외하면 실제로 Right People을 찾아낸다는 광고 채널들을 통해서 들어온 유저 숫자는 10% 남짓이다.

평소에 광고없이 Organic하게 유저 숫자가 증가하는 비중을 고려해보면, referrer 채널들 (4번 ~ 9번)이 그렇게 효과적으로 보이질 않는다. 10% 의 추가 유저 유입을 위해서 필자가 광고비에 쓴 돈을 생각해보면, 그냥 Google 검색시 상단에 배치되도록 블로그나 열심히 쓰는게 더 낫다는 지극히 평범한 결론에 이른다.

필자의 블로그가 돈벌이용으로 만들어진 페이지가 아니고, 광고에 쓰인 문구나 배너가 전문 디자이너가 만든 화려한 시각디자인이 없었다는 이유로 광고 효과가 떨어진다고 주장한다면 달리 할 말은 없지만, 저 위의 유저 스탯을 보고 난 다음에 광고에 선뜻 돈을 투자하겠다고 나서는 광고주를 찾기는 쉽지 않을 것이다.

실제로 리타게팅(Re-targeting)이라는 광고 비지니스에서 데이터 사이언티스트로 있으면서 필자가 본 내용도 크게 다르지 않다. 리타게팅이라는게 유저가 봤던 상품과 유사한 상품 중 유저가 찾아다닐만한 상품을 보여줘서 “검색 비용 (Searching cost)”를 줄여주는 광고 방식인데, 그렇게 정보 제공 효과가 있는 광고에는 반응하지만, 일반적인 광고는 거의 지면의 낭비처럼 반응한다. 국내외 대형 온라인 서비스들에서 제공하는 타게팅 광고가 Right People을 찾아내는 작업을 하고 있지만, 생각보다 큰 도움이 안 된다는 걸 저 위의 도표가 웅변적으로 말해주고 있다.

 

3. 타게팅

(구매 직전 검색 비중이 높다는 걸 보여주는 시뮬레이션)

유저들 구매 패턴을 보면서 참 신기한 게 하나 있었는데, 구매 직전에 대형 검색 서비스를 거치는 비율이 어마어마하게 높더라. 필자가 온라인 쇼핑몰에서 크리스마스 선물을 구매하려다 같은 작업을 해보니 어느 쇼핑몰에서 최저가로 구매할 수 있는지 가르쳐 주던데, 이걸보고나니 그냥 가격 싸게 책정하는게 제일 좋은 마케팅이라는 생각을 또 하게 됐다.

미시경제학에서 말하는 Bertrand Competition (가격 경쟁 모델)을 하고 있는 시장에서는 퀄리티 차이가 크게 없으니 그냥 가격을 최저로 낮추는게 가장 논리적이다. 물론 유저 유입을 위한 기본적인 마케팅은 해야겠지만, 자기가 판매하는 상품이 동질적이라면 Right, Right, Right을 찾기 위해서 광고비용을 쏟을게 아니라, 가격을 더 낮추기 위해서 노력해야한다는 뜻이다.

진짜 광고가 필요한 곳은 품질에 차이가 나고, 그 차이를 구매자가 정확하게 인지할 수 있도록 추가적인 정보를 제공해줘야하는 산업들이다. 필자가 런던에서 경제학 공부하던 시절 은사인 John Sutton 교수님의 품질 경쟁 (Quality Competition) 모델을 데이터로 검증하는 논문들을 보면, 품질 경쟁을 잡아내는 첫번째 변수가 R&D 비용이고, 두번째 변수가 가격의 다양성 (Heterogeneity), 마지막 변수가 홍보 비용이다. 타사 상품 카피가 일상인 우리나라 실정과 마지막 변수가 얼마나 맞을지는 모르겠지만, 섹션 2에서 말한대로, 정보 제공 효과가 있는 광고에만 유저들이 반응한다는 걸 알면, 고품질을 제대로 홍보하려는 시도는 자기 상품의 품질이 다른 경쟁자들과 눈에 띄는 차이가 있을때만 지불하게 되지 않을까?

판매하는 상품이 이질적이고, 구매자들도 이질적인 상황에서, 서로가 서로의 검색 비용을 줄여줄 수 있도록 빅데이터를 활용하는게 “타게팅 광고”를 제대로 활용하는 방법, “How not to waste money”가 아닐까?

 

 

나가며

얼마 전, 모 대기업에 데이터 사이언스 강의를 갔더니 필자더러 “왜 광고시장에 손을 대고 있냐?”고 질문하시더라. 아마 그 분은 개발자니까 공대 관점에서 인공지능 로봇 같은 걸 만드는데 필자의 지식을 활용하는게 더 낫지않냐는 관점으로 그 질문을 하셨을 것이다. 그런데, 필자가 공학도가 아니어서 그런지는 몰라도 단순한 자동화 기기 수준의 인공지능에는 전혀 관심이 없고, 그런거 만들어놓고 AI라고 타이틀 달아서 파는 상품 광고를 보면 비웃음이 좀 나온다. (죄송…) 좀 지적인 도전이 될만한 주제가 스타크래프트 인공지능 같은 내용일텐데, 모델이 작동하도록 데이터를 재구조화해야하는 부분에서 겪어야하는 도전의 종류가 뭔가 기계적이라는 느낌, 지적이지 않다는 느낌(?)이 들어서 별 흥미가 안 생긴다.

통계학과 실제 데이터를 다루면서 머신러닝을 바라보는 필자 입장에서는 아무래도 널린 데이터에서 남들이 못하고 있는 걸 만들어 내는데에 더 큰 매력을 느끼는 것 같다. 지금 AI라고 불리는 영역에서 다루는 데이터(ex. 음성 데이터, 센서 인식 데이터, 단순 시뮬레이션 데이터 등등)는 Noise가 거의 없는 꽤나 정제된 데이터고 (Low Noise), 이걸 어떻게 구조화시키느냐가 인공지능 서비스의 질을 좌우하는데 큰 영향을 미친다. 반면 온라인 유저 데이터같은 인간의 행동을 다루는 데이터에는 온갖 잡다한 Noise가 숨어있다 (High Noise). 이 영역에는 필자가 데이터를 재구조화할 때도 기계적인 도전이 아니라 지적인 도전이 자리잡고 있고, 당연히 모델을 만들 때도 경제학과 수리통계학적인 지식이 곳곳에서 활용된다. (딱 “내 스타일”이다 ㅋㅋ)

그 대기업 강의에서 던진 Shapley Value 라는 개념과 활용 방식에 부정적인 반응을 보이던 개발자 그룹은 아마도 “기계적”인 알고리즘이 밥벌이라서 그런 스토리에 열광하는 스타일이신 것 같은데, 그러다보니 “왜 광고에 손을 대느냐?”는 질문이 나올 수 밖에 없다는 사실이 이해는 된다. 필자가 이 온라인 광고 비지니스에 관심을 가지는 (아마도 거의 유일한) 이유는 “진짜 빅데이터”가 있는 몇 안 되는 시장이기 때문이라는 걸, 그래서 필자가 알고 있는 지식들을 “써먹을 수 있는” 시장이기 때문이라는 걸 생각해보면, 그 개발자 분들이나 필자가 무슨 산업에 있느냐가 아니라, 어떤 관점에서 머신러닝과 빅데이터를 바라보느냐가 다르기 때문이라면 논리적인 설명이 될려나?

(써놓고보니 “공부하는데 들어간 시간이 아까워서…”라는, Sunk Cost 외면하는 “변명”인 것 같다 ㅋㅋ)

 

 

비트코인의 신규 분기별 거래 발표는 언제나 흥미롭게 진행됩니다. 이와 관련하여, 베이시스의 유무는 거래자의 흥미 또는 무관심과 관련되어 있습니다. 비트코인이 20,000 달러에 가까워지고 CBOE (시카고옵션거래소) 및 CME (시카고상업거래소)의 선물 거래가 개시됨과 동시에, 2018년 3월 30일 부로 만기
예정인 비트멕스의 비트코인 / 미화 선물계약의 베이시스 변동은 거래자들의 마음을 사로잡을 것입니다.

베이시스 포인트 변동의 주요 요인은 CBOE, 특히 CME에서의 비트코인 선물 거래가 될 것입니다.

CME 거래는 아시아 시간 기준으로 월요일 오전에 시작되었습니다. 개인적인 관점에서 거래를 예측해 볼 때, 저는 베이시스가 상승 할 것이며 공격적인 거래 방식을 통해 이동 될 것으로 예상하고 있습니다. 이것은 XBTH18 베이시스의 상승 효과 역시 가져올 것입니다. 따라서, XBTH18 계약은 CME 거래를 할 수
없는 사람들에게 암호화폐 상품에 투자할 수 있는 좋은 기회가 될 것입니다.

거래 전략 1: 가격 및 베이시스가 상승장인 경우

이 거래 전략은 XBTH18 공매도를 통해 가격과 베이시스의 동반 상승을 선호하시는 분들을 위한 것입니다. 개인적으로 제안드릴 수 있는 전략 중 가장 위험성이 높지만, 동시에 가장 큰 잠재적 수익을 창출
할 수 있다는 장점이 있습니다.

거래 전략 2: 가격 및 베이시스가 상승장인 경우 (델타 중립 시)

이 거래 전략은 XBTH18 계약 공매수 vs XBTUSD 계약 공매도 시 발생하는 무차입 비트코인 델타에 투자를 선호하지 않는 분들을 위한 것입니다. 여러분께서는 XBTH18 포지션을 하고 베이시스를 확장 시킴으로써 수익을 창출하실 수 있습니다. 가격 및 선물 베이시스가 상승하게 되면, XBTUSD 스왑 또는 더욱 높은 가격에 거래 될 것입니다. 즉, 여러분께서 자금 지원을 받게 된다는 것을 의미합니다.

참고로, 해당 전략은 가격이 상승할 것이라는 여러분의 의견에 입각한 것입니다. 거래를 통해 발생 가능한 손실에 대한 불안감은 100배 레버리지를 위한 추가금을 지불할 수 있는 바이어들을 모집 할
것입니다. 이는 결국 선물 베이시스 및 스왑 자금을 상승시킬 것입니다.

거래 전략 3: 베이시스가 상승장인 경우 (델타 중립 시)

이 거래 전략은 CME 선물 베이시스에 큰 압박을 줄 수 있지만, 이는 가격 상승 여부를 확신하지 못하는 구매자들을 위한 거래 전략이 될 수 있습니다.

거래자들은 XBTH18의 공매수와 비트코인 현물을 매도해야 합니다. 이 거래 방법은 XBTH18
베이시스가 상승할 경우에만 수익이 발생합니다.

거래 시점

비트코인의 움직임은 주말에 극대화 되며, CME 상에서의 거래 전 손실에 대한 불안감은 매우 높을 수
있기 때문에, 거래자들은 가능한 한 빠른 시일 내에 거래를 시작해야 합니다.

여러분은 XBTH18 베이시스 거래가 고작 몇 퍼센트 포인트만 상승하는 볼라 세션 (Volar Session) 이후에는 토요일 아침, 일찍 일어나고 싶지 않을 것입니다. 거래 시점은 바로 지금입니다.

한 때, ‘Ashdrake 왕’ 이라 불리던 거래자가 있었습니다. 그는 루마니아 출신 프로그래머로 비트코인의 침체기였던 2014년과 2015년, 핵의 겨울 동안에도 왕성한 활동을 했습니다. 그의 전략은 비트코인을  공매도하는 것이였고, 그 효과를 다하기 전까지 아주 유용하게 작용했습니다.

비트코인이 300달러 선까지 하락했을 때, Ashdrake는 평소처럼 비트코인을 공매도했습니다.            불행하게도 그 때는 가격이 300달러에서 500달러까지 유지되었고 2달 정도 후에는 거의 600달러에
달했습니다.

그는 계좌에 있는 돈을 완전히 잃었고, 더 이상 비트코인을 거래할 수 없는 상태가 되었습니다. 판단력  부족으로 그는 강세 시장 쪽으로 눈을 돌릴 수 없었습니다. 투자자들은 “Ashdrake화 되다.” 라는 용어를 만들었고 이 단어는 비트코인 공매도로 통장에 있는 돈을 완전히 잃는 것을 의미합니다.

월요일, CBOE에서의 비트코인 선물거래가 시작되자, 경제 관련 미디어들은 필요이상으로 비트코인을
공매도하기 위해 줄을 선 기관 투자자들에 대한 보도를 쏟아냈습니다. 하지만 개시 이후 12시간
동안 CBOE에서의 1월 비트코인 선물 계약은 3번의 거래 일시 중지 조치를 당했고, 20% 넘게 상승했습니다.

고객들의 순공매도 선물 계약을 허용하지 않았던 미국의 투자 자문 회사인 Interactive Brokers사는 Ashdrake’d화 되는 것을 매우 두려워 했습니다. 그들이 위 같은 운영 방식을 완전히 바꾼 이후에도 공매도는 틀림없이 400%의 막대한 이윤을 남길 것입니다.

콘탱고 시장, 누구에게나 가능한가?

앞서 제가 언급한 바와 같이, 현물 시장에서 CBOE 선물계약은 프리미엄 기반으로 거래되고 있습니다.
이러한 선물계약에 있어 프리미엄 발생 이유는 매우 간단합니다.

현재 활동하고 있는 자산 관리사들의 평균적인 상황을 생각해보십시오. 전 세계의 중앙 은행들은 끊임없는 물가 상승을 겪고 있는 모든 자산 등급에서 발생한 변동성 문제에 부딪혔습니다. 채권, 주식, 상장
지수 펀드와 자산 담보 증권들은 특히 중앙 은행의 재무 상태표에서 두드러지게 나타납니다.

개인 투자자들은 알고있습니다. 그들은 집단으로써, 수동적인 시장 추적 상장 지수 펀드 (market-tracking ETF)에 투자하는 것이 “알파값”의 수익을 만들어내는 고급 인력에게 투자를 위탁하는 것보다 낫다는 것을 깨달았습니다. 소위 스마트 머니라 불리는 전문가들 조차 안정성을 추구하는 사람들로 미화 되었습니다.

하지만, 비트코인을 비롯한 다른 전자 화폐들의 불안정성은 계속 될 것이고 위험 자산과의 부정적인 상관관계를 가지며, 그 가치가 오를 때도 있습니다. 제가 만약 현직 펀드 매니저라면, S&P 500 지수를 밑도는 수동적인 주식 투자를 할 것입니다.

만일 제가 아무것도 하지않는다면, 더 적은 수수료가 발생하는 수동적인 ETF (상장 지수 펀드)를 통한
자산 손실과 더 큰 영업 실적의 손실을 가져올 것입니다. 하지만, 저는 대담한 태도로 저의 전체 포트폴리오와 부정적 상관관계가 있는 콜 옵션 (call option)을 선택할 수도 있습니다. 0으로 하락한다 하더라도 저는 주가 지수 이하의 투자를 계속 할 것입니다. 한 달 안에 50%에서 100%까지 수익률이 오른다면, 저의 영업 실적에 중요한 베이시스 포인트 몇 개가 더해질 것입니다. 그것이 바로 보너스로 도넛을 받느냐 혹은 단순히 일한 만큼의 댓가를 받느냐의 차이점이 될 것입니다.

이러한 콜 옵션은 공매수 비트코인 선물계약과 비슷해지고 있습니다. 저는 가격, 변동성, 상호 관계와
유동성만을 믿을 뿐, 비트코인 자체를 맹신하지는 않습니다. 저는 비트코인을 보유할 필요도 없습니다. 오로지 저는 선물계약을 위해 CBOE 혹은 CME에 맡겨진 달러를 사용하기만 하면 됩니다.

스펙은 순 공매수 비트코인 선물계약이 될 것입니다. 델타 중립적인 시장 조성자들은 선물계약을 매도하고 비트코인을 구매할 것입니다. 제가 이전에 말씀했듯이,  시장 조성자들은 그들의 USD 마진 만큼의
높은 베이시스를 지급 받아야 합니다.

불행하게도 이러한 시장 조성자들은 비트코인 공매수로 부터의 미실현 USD 이익을 그들의 공매도 선물계약 포지션상의 미실현 USD 손실을 상쇄시키는데에 사용할 수 없습니다. 그러므로 이 베이시스는 넓은 범위의 재무 상태표를 충분히 보완할 수 있을만큼 충분히 매력적이여야 합니다.

CBOE에서의 베이시스 거래는 거의 10% 가까이 상승한 상태에서 개시되었고 현재는 3%에서 5% 상승한 범위 내에서 거래되고 있습니다.

CME 거래 개시, 게임 시작!

저와 대화한 모든 거래자들은 이구동성으로 CBOE 보다 CME의 거래 계약 구조를 선호했습니다. 논란의 주요 요점은 CBOE에서는 제미니 거래소만을 유일한 가상화폐 거래소로 사용하고 있다는 것입니다. Bitstamp, GDAX 그리고 Kraken 거래소를 합친 것 보다 제미니 거래소의 유동성은 현저히 낮습니다.

월요일에 시작된 CBOE에서의 거래는 전 세계에 있는 투자자들의 욕구를 자극했습니다. 투자 전문가로 일하는 동안, 저는 새로운 선물 계약에 이렇게 엄청난 관심이 쏠린 것을 본적이 없었습니다.

게임은 이제 막 시작되었고, CME 거래에서는 미국의 전설적인 농구선수 스티브 커의 3점슛이 비와 같이 쏟아질 것입니다.

저는 CME의 월간 거래 계약률이 7%에 달할 것이고 13%의 주식 거래 중지 가능성이 있다고 예상합니다. 그리고, 아시아 시간으로 오전 중반 시간까지 거래 계약률은 일일 한계치인 20%에 도달할 것이라고 예상합니다.

비트코인 길들이기 … 그것이 해답이다

비트코인은 날뛰는 야생마와 같고, CBOE와 CME에서의 선물 거래 계약 기술은 그 말 위에서 8초 밖에 버티지 못할 만큼 부족합니다.

우리 암호화폐 거래자들은 올해의 선물 계약들을 열거하여 믿을만한 거래를 결정할 수 있게 도와주는
저희가 가진 행운에 감사해야 합니다. 그것들이 가져온 변동성과 주목성은 제 상상을 초월하는 것이였습니다.

중앙 은행은 적극적인 화폐 발행을 통해 일반 은행들을 도산 위기에서 구해냈습니다. 하지만, 세계 금융 위기 (GFC)로 부터 9년이 흐른 지금도 은행과 투자자들은 변동성에 대해 걱정합니다. 비트코인, 알트코인, 가상화폐 발표 (ICOs) 그리고 모든 방식의 디지털 토큰들은 시장 변동성의 손실을 가져왔고, 그것이 거래자들의 재산 형성을 가능케했습니다.

Jesse Livermore은 이렇게 말했습니다:

“저는 Partidge씨가 다른 손님들에게 늘 이야기하던 “음, 여러분들은 주식 시장이 호황이라는 것을 알고 있습니다.” 라는 말의 진짜 의미는, 큰 돈은 개별 투자자들의 변동성이 아닌 투자자들의 주된 움직임에 있고, 1960년대의 오래된 테입 읽기 (reading the tape) 방식이 아닌 전체 시장과 동향을 평가하는 방식을 통해서 벌 수 있습니다.” 라는 것을 깨달은 때가, 제가 투자를 배우며 크게 진일보한 순간이라고 생각합니다.  

이 이야기의 교훈: Ashdrake’d 되지 마십시오. 가격이 하락하면 매수하세요, 이해하셨죠?

요약: 몇주 전, 우리는 가능성 있는 투자 흐름과 두 체인 사이의 결론을 이끌어 내기 위해 어떻게 비트코인 캐시 (Bitcoin Cash)와 두 개로 분리되어 있는 블록체인에 대한 정보를 분석할 수 있을 지에 대한 내용을 발행한 바 있습니다. 이 보고서에서는 비트코인 골드 (BTG)에 관한 비슷한 분석을 제공 할 것입니다.

 

비트코인 골드 개요

비트코인 골드는 비트코인과 비슷한 체인 분할 토큰 (Bitcoin Chainsplit Token) 입니다. 491,406번째의 비트코인 블록을 소유한 사람들은 누구나 (2017년 10월 24일 이후 발행 기준으로) 이에 상응하는 동일한 양의 비트코인 골드를 할당 받았습니다. 몇몇 거래는 거래자들로 하여금 이 날부터 그들의 비트코인 골드를 하드포크 시점에서 거래자들의 잔고를 기반으로 거래할 수 있게 허용했습니다. 하지만, 비트코인 골드 블록체인 (Bitcoin Gold Blockchain)은 그 자체적으로 21일 후인 2017년 11월 14일까지 사용
불가능 했습니다.

비트코인 골드의 목표은 해싱 알고리즘 (Hashing Algorithm) SHA256에 기초한 Equihash 알고리즘으로 변경하여 채굴 중앙 집중화 현상 (Mining Centralization)을 개선하기 위한 것입니다. Equihash
알고리즘은 ASIC 중심의 SHA256보다 그래픽 처리장치에 더욱 친화적입니다.

 

코인 채굴자들을 위한 비트코인 골드 할당

100,000 코인이 생산되고 그것이 비트코인 골드 팀원들에게 할당되지만, 비트코인 프로젝트 팀은
그 사실이 널리 알려지기를 원하지 않습니다. 할당량은 12.5 BTG의 블록 보상과 동일한 8,000 블록
보상으로 구성되어 있고, 그 양은 100,000 코인에 해당합니다.

하나의 코인 당 450 달러인 비트코인 골드의 현물 시세를 기반으로, 이것은 약 4,500만 달러의 가치가 있습니다. 많은 사람들에게 겉보기에 불필요한 할당은 비트코인 골드의 완전성을 해치는 것처럼 보일 수도 있습니다. 비트코인 캐시의 경우 이러한 할당 또는 배분을 하지 않습니다. 누군가는 다음과 같이 주장할 수도 있습니다. 포크 이후의 기간 동안, 비트코인 캐시의 조정 메커니즘 상의 원초적 어려움이 이전에 없던 코인의 대량 생산을 가능하게 했다고 주장할 수 있습니다. 이것은 누구나 비트코인 캐시를 채굴할 수 있고 그것이 바로 할당되지 않는 비트코인 골드보다 조금 더 공평해 보이기도 합니다.

 

전체 코인 소비량

2017년 12월 20일을 기준으로, 261만 비트코인 골드 토큰이 최소 1회에 걸쳐 소비되었습니다. 이와 비교해 비트코인 골드 거래가 가능해진 시점과 스냅샷 포인트 이후에 각각 470만과 240만 토큰이 소비되었습니다. 이것은 비트코인 캐시 하드 포크 시점 이후 같은 일 수 후에 410만 토큰이 소비된 것과도 비교할 수 있습니다.

소비된 261만 비트코인 골드는 전체 비트코인 골드 중 15.8%에 상응합니다. 저희의 시각으로 볼 때,
이것은 비트코인 골드의 투자 회수 단계와 연관되어 있습니다. 왜냐하면, 동일한 기간 동안 비트코인의 초기 소비량에 비교할 때, 261만 코인 (비트코인 골드 기준)이라는 지수가 더 높기 때문입니다.

 

그림 1 – 비트코인 골드 (BTG) vs 비트코인 (BTC) – 비트코인 골드 (BTG) 가격 및 체인 분할에 비교한 이래, 최소 1회 소비한 코인의 수

출처: 비트멕스 리서치, 비트코인 블록체인, 비트코인 골드 블록체인, 비트파이넥스 (가격 데이터)

 

최초 비트코인 캐시 일일 소비량

비트코인 골드의 최초 일일 소비량의 평균은 출시 직후 초기에 비해, 약간 낮아지고 있는 추세입니다. 출시 직후, 첫 10일 동안의 평균이 약 110,000 이었던 것과 반대로 지난 10일 동안의 최초 일일 소비량의 평균은 44,000로 나타났습니다.

 

그림 2 – 비트코인 골드 가격 비교에 의한 분할 (하루 100만 기준) 이후 비트코인 골드 최초 소비량

출처: 비트멕스 리서치, 비트코인 골드 블록체인, 비트파이넥스 (가격 데이터)

 

보안 이슈

2017년 11월 21일부터 25일까지, 공식 비트코인 골드 깃허브 저장소가 해킹을 당했다는 의혹이 있었고, 공식 웹사이트는 악성 지갑으로 전락하게 되었습니다. 비트코인 골드 팀의 발표에 따르면, 악성 지갑은 악성 실재가 지갑이 공급한 새로운 비트코인 골드 주소들을 보낸 펀드에 접근하는 것을 가능하게 했고, 그 결과 비트코인이 아무런 영향을 받지 않은 것은 물론, 기존의 개인 정보 보안 키들 또한 손상되지 않았습니다. 어떤 일이 발생한 지는 명확하지 않지만, 비트코인 골드 팀은 최소한 80개의 비트코인 골드가 도난 당했다고 주장합니다. 저희는 이 사건의 심각성을 감안할 때, 훨씬 더 나쁜 영향력이 있을 수도 있다고 생각합니다.

이 도표는 새로운 하드 포크 토큰을 주의 깊게 다루는 것이 왜 중요한지를 보여줍니다. 특별히, 저희는
토큰 스냅샷 시점 이후에 다른 개인 키와 관련된 새로운 결과에 비트코인을 처음 지출하지 않고,
여러분의 비트코인 개인정보 보안 키를 새로운 하드포크 토큰 지갑에 보관하는 것을 권장하지 않습니다.
이를 통해, 여러분의 비트코인을 위험으로부터 안전하게 보관할 수 있을 것입니다.

학부 3학년이었던 2006년 11월의 어느 날이다. Bain & Company라고, 꽤나 유명한 전략 컨설팅 회사에 면접을 갔었다. 그 때 인생 처음으로 정장도 한 벌 샀고, 겨울이라 춥다고 좀 비싸보이는 코트도 한 벌 사서 허겁지겁 면접을 갔다. 태어나서 첫 면접이라 참 시원하게 말아먹고, 뭐 어찌어찌해서 Bain & Company의 모든 컨설턴트들이 (너무 빡세서) 안 할려고 했다던 컨설팅 건 하나에 인턴 자리를 얻게됐다. 그 두 달이 채 안 되는 기간동안 새벽 2-3시 전에 집에 가는 일이 거의 없이 일만하던 그 무렵, 필자는 컨설팅은 절대로 안 하겠다고 백번 다짐을 했었다. 데이터를 까서 뭔가 제대로 분석은 없고, 단순하게 “감”을 바탕으로한 슬라이드와 해외 사례들만 덕지덕지 붙은 그 슬라이드 150장이 지금도 가끔 생각난다. 오죽했으면 인턴 마지막 주에 윗 분들이 발표 들어가셨을 때 True North라는 Bain & Company 로고를 뒤집어서 True South로 바꾸고 혼자 히히덕거리며 소소한 분노를 표출했었다.

꼭 1년 후, Deutsche Bank IBD팀에서 역시 밤을 꼴딱새며 일을 하고 있던 그 무렵, Bain & Company 에 1년 반 정도 경력이 있으신 분이 필자의 팀 인턴에 지원을 하셨더라. 혹시나 싶어서 알고 지내는 형님을 통해서 물어보니 역시 예상대로 그 형님의 고딩/대딩 선배님이시고, 얼마전에 컨설팅은 정말 아닌 것 같다는 생각에 그만두고 나가셨다고. 필자가 IBD 업무는 결국 접대와 술자리의 연속인 것 같아서 도망나오고 싶던 시절이었기 때문에, 이 분을 꼭 뽑아서 (죄송하지만) 내 대타로 삼아야겠다는 생각에 면접을 봤다. 그 때 레쥬메에 쓰신 컨설팅 프로젝트 4건은 고객사 이름을 안 넣었는데도 어느 회사에서 어떤 일을 하셨을지 눈에 훠~언~히 보이더라. 데이터로 증명할 수 없고, 검증할 수 없는 이야기를 “멋있는” 슬라이드로 만들어내야하는 압박에 시달리면서 아마 자존감에 많은 상처를 입으셨을 것이다. 필자가 그렇게 도망나와서 공부를 더 하겠다고 박사 학위에 도전장을 내밀었던 것처럼, 그 분도 괜히 IBD 지원하지 말고 필자와 유사한 길을 걸으셨어야하지 않을까…어차피 뱅킹이나 컨설팅이나 그 나물에 그 밥인데…

별로 기억하고 싶지 않은 첫 직장 이야기인데, 굳이 외부에 공개하는 글에 언급하는 이유는, 주말에 비슷한 류(?)의 고민을 하시는 자칭 필자의 “팬”이라는 분의 이메일을 받았기 때문이다.

 

1. 우리나라 “빅”데이터 컨설팅의 현황

가끔 필자더러 “빅데이터 컨설팅에 관심없냐?”는 질문을 하시는 분들이 있다. 이미 다른 글에서도 몇 번 언급했듯이, 그렇게 질문하시는 회사의 대부분은 제대로된 데이터가 없다는 걸 벌써 몇 번이나 겪어봤기 때문에 필자는 반응이 뚱~ 하다. 설령 필자가 기대하는 수준의 데이터가 있다고해도 필자가 해주는 분석을 이해할 수 있는 사람이 없을텐데라는 생각에 몇 번 회사들이랑 미팅해보고는 맘을 접었다.

그 “팬”이라는 분이 “빅”데이터 컨설팅을 해주는 회사에 다니시면서 갑갑한 경험을 하신 사례를 장문의 이메일에 읊어주셨는데, 읽다보니 저 위에 쓴 필자의 사회 초년병 시절이 새록새록 떠오르더라. Balance 안 맞는 valuation model 템플릿 던져주면서 그걸로 현금 흐름 예측한 자료 만들라길래 balance가 안 맞는 걸로 어떻게 모델을 만드냐고 얼굴이 울그락붉그락해져서 질문하니 그냥 시키는대로 하라던 이사님 얼굴도 떠오르고.

이 분은 그래도 나름대로 학위와 짬이 골고루 갖춰진 팀에서 일을 하시는 것 같은데, 메일에 쓰신 내용만보면 통계학 모델링의 기본을 놓치고 있는 이야기가 너무 많다. test-stat을 무시하고 단순하게 coefficient만 본다던가, multicollinearity를 무시한다던가, 변수 선택을 하는데 느닷없이 Random Forest의 Variable Importance를 쓴다던가 하는 말을 보고 참 황당했다. “팬”이라는 분의 윗 사람들은 다들 공부하신 분일텐데, coefficient만 본다는 건 정말 고딩 수준이라는 이야기고, multicollinearity를 무시한다는건 학부 1학년 때 배우는 선형대수를 모른다는 이야기고, Random Forest의 Variable Importance를 회귀분석의 변수 선정용으로 쓴다는 건 Euclidean distance 모델과 Tree distance 모델의 거리 계산 기준이 근본적으로 다르다는 걸 제대로 모르고 있기 때문에 하는 일들이다.

데이터를 (거의) 안 쓰는 컨설팅 회사, 데이터를 쓰기는 하지만 엑셀로 단순 작업만하고 사실은 음주가무 접대가 더 중요했던 뱅킹까지, 나름대로 당시 우리나라 최고의 직장들을 때려치우고 나와서 대학원으로 향할 때는 그래도 박사님들은 좀 더 제대로 된 작업을 하실 줄 알았다. 그런데 교수, 박사 타이틀을 달고 있으신 분들이 저런 식의 주먹구구식, 수학 제대로 못 쓰는 작업을 하면서 돈 벌이에 나선다니….

 

2. “빅”데이터 컨설팅이 “제대로” 될려면 – 시장 교육

필자가 뱅킹을 그만두고 나올 때 가까운 친구들이 항상 했던 말이 있다. “타협”을 해야한다고. 어차피 니가 다 맞는거 아니지 않냐고. 다들 그렇게 타협하고 살고, 그렇게 버는 돈으로 먹고사는 거라고. 니가 수학적으로 완벽한 작업을 해서 줘도 어차피 고객사는 못 알아먹는다고. 그들이 원하는 답을 만들어주는게 더 큰 가치가 있는거라고.

그 친구들의 이야기를 들을 때 머리 속에 딱 떠올랐던 생각이 미국 최대 회계 부정 스캔들인 “엔론(Enron)” 사건이었다. “사소한(?)” 회계 부정만 눈 감고 넘어가면 그 집단의 인사이더들은 다 잘 먹고 살 수 있거든. 엔론은 물론이고, 회계 감사하던 회계 법인, 엔론에서 수임료를 꼬박꼬박 받던 법무법인 등등 관련 “지식인” 그룹들은 그 부정을 눈 감아 주기만 하면 당장 돈 벌이를 할 수 있으니까 쉬쉬하고 넘어가버리는 것이다. 더 웃긴건, 그렇게 대형 비리 사건이 터졌는데 정작 관련 회계사나 변호사들은 싹 다 도망가버렸더라. 아마 저 위의 “빅”데이터 컨설팅도 그렇겠지. 위험하다 싶으면 발을 슬쩍 빼내고 모른체로 일관하겠지.

어차피 “담합”은 내부자가 아니면 깨기 어렵다. 청문회 영상을 보면 끝까지 모르쇠로 일관하는 핵심 관계자들을 얼마나 많이 봤는가?

이 문제는 결국 돈을 주고 그 서비스를 쓰는 “갑”들이 얼마나 똑똑한지에 의해 해결의 실마리가 풀릴 것이라고 본다. (국민이 똑똑해져야 언론이 제대로 일을 하고 비리를 파헤치는 것처럼.) 금융기관 고위직 중에 세일즈로 올라간 분들을 제외하면 나머지 최고위층 인력들은 대부분 경제학 박사나 유사한 타이틀을 들고 있다. 이게 단지 그 타이틀에 세상이 굴복하기 때문이기도 하겠지만, 복잡한 논리를 이해할 수 있으려면 그만큼의 학문적 훈련을 받았어야한다는 걸 임명권자도 은연중에 알고 있기 때문일 것이다.

“팬”님의 메일에도 우리나라 “빅”데이터 컨설팅 분위기가 저품질 저비용을 찾아다니는 느낌이지, 뭔가 제대로된 수학, 통계학을 이용한 분석을 이해하고 받아들이는 분위기가 아닌 것 같다고 하소연을 해 놓으셨더라. 시장 수준이 낮으니까, “갑”들이 교육은 안 받았으니까, 그저 화려한 세일즈 피치에만 관심을 갖고, 그 내용 중에 대부분은 못 하는 내용이라는 걸 이해 못하고 있는거다. 마치 10년 전 금융 시장에서 기업 가치 평가 모델을 만들면 “무슨 기계가 있어서 거기 집어 넣으면 툭~ 튀어 나오는거야?” 라고 묻던 한심한 어느 은행 고위직 관계자처럼. “팬”님의 눈에도 그저 새로운 기술이 나왔다면 열광하고, 그걸 할수 있다고 주장하는 사람들 중에 그럴듯한 타이틀이 있는 사람들에게 돈을 쓰고, (당연하겠지만) 결과물이 안 좋으니 실망하고, 바보 “갑”들 때문에 그렇게 시장이 활력을 잃어가는 상황이 눈에 들어오시는 것 같다.

저 위의 실력 없는 “을”들이 시장을 망쳐놓는 상황, 그리고 그 실력을 제대로 평가하지 못하는 “갑”들이 그저 타이틀에만 현혹되는 상황을 깨는 유일한 방법은 시장이 성숙하도록 사람들을 가르치는 수 밖에 없다. 그런데, 금융시장에서 자사주와 M-M Theory를 제대로 이해 못하던 사람들을 보니, 결국 그 사람들이 퇴출되도록 한 세대가 지나야 문제가 해결이 되더라. 나름대로 Turn-over가 빠르고 빨리 은퇴를 해야하는 증권사에서 10년 정도가 걸려 한 세대가 정리되니 이제 좀 덜떨어진 소리하는 사람이 없어진 걸 보면, IT업계에서 데이터 분석 이야기하는 분야도 최소한 비슷한 세월이 걸려야 정리되지 않을까 싶다.

물론 그 전제조건은, 새로운 인력이 “제대로” 교육 받고 시장에 진입해야한다는 거다. 썩은 물에 썩은 물이 유입된다고 물이 깨끗해지는건 아니니까.

 

3. “빅”데이터 컨설팅이 “제대로” 될려면 – 데이터 베이스 구축

가끔 필자의 수업을 들으시고는 우리 회사에도 이런 분석을 적용해보고 싶다고 말씀하시는 분들이 꽤나 있는데, 정작 그렇게 말씀하시는 분들 대다수는 제대로 된 데이터 베이스를 안 갖고 계신다. 올 가을에 실리콘밸리랑 한국에 듀얼로 운영되는 스타트업에서 C-level이신 분을 한 번 만났다. 필자더러 개발자냐고 물을만큼 정말 아무것도 모르는 티, 전혀 준비 안 한 티가 너무나서 차나 한잔 하라고 소개시켜준 친구에게 나중에 화를 내야할만큼 깝깝하신 분이었는데, 실리콘밸리에서 나름 명성있는 VC한테 투자도 받고, 사업 초반부도 아니고 서비스가 돌아간지 한참이 되었건만, 정작 데이터 베이스 구축에는 한번도 관심을 안 가진 티가 너무 나더라.

한국 상황이 딱 그렇다. 뭔가 “빅”데이터 이야기는 많이 들었는데, 정작 데이터 베이스 구축도 제대로 안 되어 있고, 그거 돈 들어가는거 아니냐, 그렇게 돈 들어가면 ROI 나오냐는 이야기가 먼저 나온다. 자기네들이 지금처럼 주먹구구식 통밥으로 운영해도 크게 문제 없는데, 굳이 그렇게 돈을 들여서 서버를 구축하고 데이터를 모아야하냐는 이메일도 받은 적이 꽤나 있다. 더 웃긴건, 그런말을 하면서 자기네 회사에 TensorFlow 알고리즘을 적용하고 싶은데 어떻게 하면 되냐, 필자의 수업 한 달 듣고나면 할 수 있냐고 묻더라. (욕 좀 썼다가 내 블로그를 더럽히고 싶지 않아서 삭제한다. 어휴~)

“팬”이라는 분이 보내신 메일에 보면 데이터 베이스 관련 개발 & 솔루션 판매업을 하는 회사에서 전산이나 컴공 전공인 사람들이 요새 트렌드에 맞춰 데이터 분석 프로젝트를 해볼려고 하는데, 결국 뭔 말인지 모르니까 인터넷에 돌아다니는 코드 몇 줄 바꿔서 치는 식으로 프로젝트해주고 있다는 이야기도 있었다. 솔직히 이런거 너무 많이 봐서 이젠 놀랍지도 않다.

제대로 이 서비스가 돌아갈려면, 데이터 베이스가 안정적으로 돌아갈 수 있도록 구조화해주는 팀, 그 데이터를 바탕으로 분석하는 팀, 그리고 그 데이터 서버를 이용해서 다른 돈벌이를 할 수 있는 팀 같은 여러 팀 업무가 유기적으로 돌아가야한다. 지금 시장은 이런 이해가 제대로 갖춰져있지도 않고, 또 인력도 부족하다보니 그냥 “데이터”라는 단어가 들어가면 다 잘하는가보다, 데이터 사이언티스트면 데이버 엔지니어링도 잘 하겠지라고 생각하는 거다. 더 심하게는 데이터로 뭔가 작업만하고 있으면 무조건 “빅”데이터를 다루는 “데이터 과학자”라고 우기는 판국이니…

필자의 수학&통계학 시간에 간략하게 수학 모델 리뷰를 한다. 데이터가 엉망으로 들어가면 제 아무리 모델이 좋아도 모델의 결과값은 엉망이 될 수 밖에 없다고. 데이터 사이언스 수업 시간에는 Garbage In, Garbage Out (GIGO)를 실제로 보여준다. 어차피 돈 벌려고 하는 수업도 아닌데, 시장이 좀 빨리 성숙해서 그런 강의는 시시해서 안 듣는 시절이 왔으면 좋겠다.

 

나가며

2017년 9월에 수업에 찾아오셨던 모 통신사 개발자 분이 수업 끝나고 뒷풀이 자리에서 그런 말씀을 하시더라. 처음 수업에 오기전만해도 어느 대학에서 나온 “서버 안정성에 대한 머신러닝 분석~” 같은 보고서가 참 대단하다고 생각했었는데, 모델들이 어떻게 구성되고, 이걸 어떻게 구현하는지를 좀 이해하고 난 다음에 다시 보고서를 보니 주먹구구식으로 엉망으로 만든 티가 너무 나는게 보였단다.

아마 그 보고서를 쓴 분도 저 위의 “팬”이라는 분이 겪은 좌절감과 비슷한 감정을 겪으시면서 썼을 것이다. 데이터는 없고, 있는 데이터는 오류 투성이라 제대로 classification은 안 되고, 그렇다고 오류 투성이고 해결 불가능이라는 결론을 도출하는 보고서도 못 내겠고…

그 개발자 분의 쫑파티 자리 코멘트를 보면서 한편으로는 한국 시장의 수준에 안타까움을 느꼈지만, 또 다른 한편으로는 저 정도로 열정있고 실력있는 분이라면 한 달만에 제대로 보고서를 볼 수 있는 눈이 생길 수 있을만큼 한국 시장에는 좋은 인재가 참 많다는 생각도 하게됐다.

가끔 사람들이 그런다. 왜 한국 왔냐고. 미국에 있는게 훨씬 더 낫지 않냐고. 여러 이야기 끝에 항상 이렇게 대답한다. 한국에는 “흙 속의 진주”가 정말 많다고. 사업할 수 있는 환경은 미쿡보다 좀 덜 좋을지 몰라도 인재라는 측면에서는 진짜 좋은 시장이라고. 돈 안 되는 강의와 돈 안 되는 블로그지만, 그래서 귀찮게 뭐하러 운영하나는 생각도 하지만, 그래도 가끔씩 “흙 속의 진주”들을 만나는 재미가 쏠쏠해서 못 끊겠다. 어서 빨리 그 분들이 흙 밖으로 나오도록 해야할텐데…

철학자님이 수포자에 대한 필자의 글을 읽으셨는지, 또 재밌는 글들을 더 보내주셨다. 프랑스 철학자 루소의 “인간불평등 기원론”에 필적할 연구가 필요하다는 생각이 든다고 하시는데, 일단 아래의 인용문구를 먼저 소개한다.

최초의 좌절: 그대의 책임이 아니다.
“태초에 폭력이 있었다. 그 폭력은 그 분이 수학을 창조하셨다는 것이다.
수학교육을 통해 열등감을 가진 80%를 만들어 그들을 저임금 근로자로 삼으라.
수학을 적당히 잘하는 나머지 18%를 중간 관리자로 만들어 그들을 통제하게 하라.
수학
을 아주 잘하는 1.8 %를 지식인이라고 부르자.
(중략)
신이
시여, 나머지 0.2 %는 슈퍼 울트라 수학을 잘하는 사람이겠군요? 아니다. 그들은 수학을 할
필요조차 없는 사람들이니 내가 진정으로 사랑하는 나의 아들이다.” – 수학 창세기 –

금수저 (또는 다이아몬드 수저)를 물고 태어나신 0.2%가 아니면 수학 실력으로 자신의 신분이 결정된다는 식으로 희화화해놓은 문구인데, 솔직히 말하면 필자의 철학과 많은 부분에서 일치한다.

 

1. 알맹이없는 머신러닝 강의

지난주에 어느 모임에 갔다가 머신러닝 강의하신다는 분을 만났다. 자기가 무슨 4차 산업혁명을 이끄는 선두주자인 것처럼 거드름을 피우는 꼴이 너무 아니꼬워서 그냥 무시할려다가 도저히 못 참고 말을 걸었다. 어떤 내용 강의하시냐니까 예상했던대로 Logistic이랑 RandomForest 비교하고, TensorFlow 코드 짜는거 가르쳐주고, 간단한 챗봇 만드는거 알려준단다. 속으로 너 잘 걸렸다 싶어서, 챗봇 만들 때 문장 쪼개서 단어들 구분하는건 어떤 방식으로 진행하시냐니까 갑자기 놀란 눈으로 필자를 쳐다보더니, 말을 얼버무리기 시작하더라. 명사랑 형용사, 부사는 구분할 수 있어도 동사 구분하기는 쉽지 않을텐데, 그리고 우리말 사전 데이터 베이스는 어떤 걸 불러와서 챗봇에 Feeding 시키냐고 물으니까… 도망가더라.

(그 분 혹시라도 지금 이 글을 보신다면, 앞으로라도 이 글을 보신다면 공부 좀 하고 다시 필자에게 찾아오셔도 좋다.)

챗봇에 들어가는 모델링 방식은 Recurrent Neural Network (RNN)라고, 시계열 다루는 용으로 변환시킨 Neural Network 모델이다. 그 중에서 챗봇은 과거의 단어 조합 패턴을 정확하게 기억해내서 현재의 문장 흐름에 매칭을 시켜야하기 때문에 RNN 중에서 Long-Short-Term Model (LSTM)의 Memory Cell을 활용한다. 수백, 수천가지의 Memory Cell이 동시에 작동해야하기 때문에, 당연하겠지만 Computational Cost가 매우 많이 필요한 작업이다. 이걸 해결하려면 여러 Sequence들을 단어나 문장 데이터 형태로 저장하는게 아니라 단순한 숫자 조합 (정확하게는 행렬)으로 저장해놓고 Memory cell이 켜질 때마다 불러오는 식으로 구조화해야할텐데, 아마 그런 내용은 하나도 모르고 계시니까, 단순하게 어딘가에서 (아마도 Github?) 챗봇 알고리즘을 찾아서 그걸 사람들 앞에서 실행하고 있는 수준이어서 일 것이다.

(도망간게 아니라면, 정말 억울하다면 꼭 필자를 찾아와주시기 바란다. 회사 주소는 하단에 있다.)

저런 수업을 진행하고, 또 그 수업을 듣고 뭔가 많이 알았다고 뿌듯해하는 사람들이 바로 철학자님이 말하는 80%인 것이다. (이 분들이 돈이 되기 때문에 강의해주는 기관이나 책 장사 하시는 분들이 80%를 타겟으로 해 달라고 여러번 이야기를 하신다.)

그리고 그들을 대상으로 하는 강의는 매우 쉽게 카피가 가능하다. 필자같이 자존심이 좀 쎈 사람은 아예 가르칠 생각도 안 한다. 내가 하는걸 남들이 금방 카피할 수 있다면 내 수준이 같이 낮아지는 느낌이 들기 때문이다. (1.8%가 될 수 없을지라도 최소한 80%로 추락하고 싶지는 않다 ㅎㅎ)

 

2. 수포자가 생기는 이유?

11월에 강의 끝내고 수강생 한 분과 방향이 같아 같이 대중교통을 이용해서 귀가하던 길에 이런 질문을 받았다. 사람 뽑을 때 가장 중요하게 보는게 뭐냐고.

필자는 딱 2가지를 본다. 수학을 얼마나 잘하냐와 얼마나 적극적으로 문제를 해결하려는 의지를 가졌는지. 그런데, 많은 경우에 두 가지 특징은 사실 하나더라.

(그나저나 “내가 멍청해서”라는 답안지는 왜 없을까?)

왜 수포자가 되는지 설문조사 내용을 보면 (상단 그래프 참조), 대다수는 내용이 어렵다는 이야기를 한다. 그런데, 필자와 같은 세대 고교 수학을 공부하신 분은 알겠지만, 요즘 고교 교과서의 수학은 필자가 고교를 다닌 1990년대 후반보다 훠~얼~씬 쉽다. 수포자 많이 생긴다고 정치권에서 수학을 쉽게하면 수포자가 덜 생길 것이라는 논리를 들이대서 이것저것 어려운(?) 내용을 다 빼낸 교과서가 요즘 교과서인데, 그 덕분에 수포자가 많이 줄었나? 글쎄…

수포자는 내용이 어려워서 생기는게 아니라, 어려운 문제를 만났을 때 포기하기 때문에 생긴다. 여기서 수학 좀 할 줄 안다고 으시대는 필자인들 처음부터 수학이 술술 풀렸겠는가? 중학 시절에는 30/100점 받은 시험도 있고, 고교 시절에 진짜 열심히 공부하고도 77/100점 받은 시험도 있다. 학부 고학년 시절 계량경제학에 나오는 수학도 헤매며 따라갔고, 나중에 박사 학위때는 Stochastic Calculus라고, 어지간히 수학 공부한 사람들도 어려워하는 내용까지 정말 꾸역꾸역 이해하면서 한 발자국 한 발자국 나아갔던 기억 밖에 없다.

문제가 어려우면 도전해서 적극적으로 이해하고 문제를 풀어내는 성취를 맛 본 학생들은 그렇게 쉽게 포기하지 않는다. 말을 바꾸면, 수포자가 생기는 이유는 내용이 어려워서가 아니라, 머리를 써야 이해할 수 있는 상황에 직면하면 그냥 손을 놓기 때문이다. 머리를 써서 이해하려는 시도를 제대로 안 했기 때문에, 최소한 그 시점에 선생님이라는 사람이 도와줘서라도 극복할 수 있었어야하는데, 그 기회를 놓치고 좌절에 익숙해졌기 때문이다.

 

3. 수학이 들어간 머신러닝 강의

그 수강생 분이 그러시더라. 수업 듣고나니 그 회사에 입사할려면 수학 진짜 잘해야 될 것 같다고. (참고로 이 분은 Anaconda 4.2.0에서 4.4.0으로 업그레이드 되면서 Python의 데이터 array 방식이 바뀐 탓에 이전에 공유했던 코드가 안 돌아간다고 일주일 동안 머리를 싸맬만큼 열심히 공부하셨던 분이다. 수업 시간에 array 시작 포인트를 0에서 1로 바꾸고 다시 돌려보라니까 속이 시원한 표정을 짓던게 기억난다.)

물론 철학자님이 말하는 상위 1.8%는 상대적으로 더 쉽게 허들을 넘는다. 이 학생이 수학적인 센스가 뛰어난 사람인지 아닌지 판단하는 몇 가지 문제 풀(Pool)이 있는데, 그 중 하나를 수학&통계학 강의 시간에 던졌더니, 한 두가지 힌트만 듣고 대답해내는 수강생을 본 적이 있다. (그 분, 제가 얼굴 기억하니까 찾아오시면 밥 삽니다 ^^) 연구소에 박사님들 대상으로 강의할 때는 보자마자 바로 답이 나오는 분도 있더라.

이런 센스가 있는 사람들은 어차피 넘사벽이다. 다만 그들만 할 수 있는 것처럼 지레짐작하고 포기할 필요는 없다는 말을 하고 싶다. 어차피 회사에서 쓸만한 데이터 사이언스 지식은 넘사벽의 누군가가 만들어내서 우리가 활용하는 지식이지, 넘사벽이 아닌 18%에 속하는 당신이 만들어내는 지식이 아니다. 단지 자신이 18%에 속하는데도 불구하고 80%에 속하는 것처럼 굳이 좌절할 필요는 없지 않나?

학부 경제학을 한 수강생이나, 컴공 출신 수강생들의 이해도를 보면, 이게 “불가능”한 내용이 아니라, 그냥 좀 “어려운” 내용이고, 그렇다고 “포기”할 만한 내용은 절대로 아니라는 걸 눈으로 확인할 수 있다. 단지 이걸 이해하는데 필요한 훈련이라는 것이 코딩이 아니라 학부 수준의 통계학이라는 걸 보여주는거지.

 

나가며

지난 글에서 밝힌 어느 대기업 강의를 끝내고 기자재 정리를 하는데 한 분이 찾아오셨다. 이렇게 직관적으로 이해가 잘 되는 통계 강의는 처음 들었다면서, 필자가 홈페이지에서 제공하는 강의에는 어떤 걸 가르치냐고 물으시더라. 혹시나 전공이 어떻게 되냐고 여쭤보니, 역시나 경영학이란다. 대기업용 강의처럼 가벼운 내용만 가르치는 수업이 아니니 경영학과 출신이시면 어려울 것 같다고 솔직한 말씀을 드렸다. 욕심이 나면 먼저 수학&통계학 수업 듣고, 거기서 힘들고 못 따라올 것 같다고 판단되면 그냥 접으시는게 맞을 것 같다고,

굳이 따지고 들자면, 학부 경제학을 한 필자의 절친들이 통계학을 제대로 기억하는 경우도 거의 없고, 반대로 비전공자인 철학자님이 PCA를 “자연이 가르쳐 준 축”이라고 잡아내주실 정도로 이해도가 깊은 걸 보면, 학부 전공은 무의미할지도 모르겠다. 학부 전공과 별개로 고교 시절에 자기가 배우고 익힌 수학이 1.8%냐, 18%냐, 아니면 80%냐에 따라 결정되는 걸지도.

모르긴 몰라도, 앞으로 몇 년 안에 회사들 데이터 베이스가 제대로 구축되고 나면 1.8%의 몸 값은 지금보다 몇 배는 치솟을 것이다. 그래, 인간은 불평등하다.

 


위의 내용에 일부 코멘트 추가 합니다.

비전공자인줄 알았던 철학자님이 제 학부 선배 (서울대 경제학부) 이시고, 미국의 매우매우매우 유명한 대학에서 경제학 박사 학위를 받으신 후, 현재 서울시내 모 대학의 교수로 재직 중이신 것을 우연히 알게 되었습니다. 까마득한 후배가 선배님을 몰라뵈어서 대단히 죄송합니다.

2달 전 수업을 듣고가신 그 철학자님께서 가끔 재미난 글을 찾으시면 메일을 보내주신다. 필자와 핀트가 맞아서인지 (감히 철학자님께 핀트가 맞는다는 표현이 적절한지는 모르겠지만) 좋은 글들이 많은데, 어제는 요즘 필자의 관심사를 어떻게 알아내셨는지 “‘수포자’의 잘못된 원인 분석이 잘못된 해법을 부른다.”라는 글을 보내주셨다. 링크를 따라가면 꽤나 장문의 분석글을 읽을 수 있는데, 핵심 포인트를 두 개 잡아내면, “수학이 필요하지 않다는 생각에 수포자가 된다”“자신감을 상실했기 때문이다”로 요약할 수 있을 것 같다.

글 자체가 굉장히 분석적이어서 여러 군데 마음에 드는 구절들이 많지만, 일단 오늘 필자가 집중하고 싶은 부분은 “수학이 필요하지 않다는 생각”이다. 최근에 만나고 있는 자칭 “머신러닝 경험자”인 개발자들과 “데이터 분석은 그래프만 예쁘게 그리면 된다”고 주장하던 옛 직장 동료들에게서 꾸준히 오랫동안 지속적으로 봐왔던 생각이기 때문이다.

 

1. 수학으로 만들어진 세상

필자는 수학 이름이 들어간 높은 학위를 갖고 있어서가 아니라, 어릴 때부터 굉장히 수학을 좋아하고 즐겁게 공부하는 사람이었다. 필자의 고교 진학과 대학 진학은 모두 수학, 과학이 역사상 최고 난이도로 나온 시험이었던 덕분이라고해도 과언이 아니고, 고교 시절에는 야자 시간에 잠을 깨려고 수학책을 꺼내서 문제를 풀었던 정도로 수학을 즐기면서 공부했었다. 그런 필자도 박사시절 Functional Theory를 이용해서 우리 학문의 문제들을 증명하는 지도 교수님 수업을 “포기”하고 싶더라. 굳이 Functional Theory 아니라 대수나 기하학으로 충분히 같은 증명을 할 수 있다는 생각도 들었고, 더 나아가서는 굳이 저걸 증명해야할 필요가 있을지에 대한 확신이 별로 없었기 때문이다. 사실 박사과정 중에 배우는 많은 증명들을 그렇게 무조건 암기만하고 넘어갔던 적이 많았다. 나중에 논문 쓰면서 다시 그 증명들을 찾아볼 때야 비로소 그 증명의 가치를 늦게나마 깨닫고 필자의 게으름을 탓하기는 했었지만.

(A joke: An Aztec math problem set. Archaeologists have hard time locating a solution plate.)

일상 생활에서 수학의 가치를 발견하기란 참 쉽지 않다. 가깝게 지내던 변호사 친구는 수학은 아무짝에도 쓸모없는 지식인 것 같다면서, NASA가 우주선 만들어서 쏘아올리는거 전부 다 공학으로 만들어내는거 아니냐고 그러더라. 그 말의 의도는 공감하지만, 사실 그 우주선의 부품 생산부터 조립까지 모든 단계의 밑바닥에는 무시무시한 수학들이 숨어있다. 비전공자들은 모르겠지만, 로켓의 속도에 따라 공기저항이 생기고 이때 생기는 열을 어떻게 차단하는지 여러 물질을 놓고 테스트하기 전에 수학/물리학 이론을 바탕으로 대부분의 랩 내 실험을 생략한다. 금융위기를 가져왔던 복잡한 파생상품들을 기억하시는가? 그 상품들의 적정가격을 계산하는 석사 프로그램 이름은 “Financial Engineering“인데, 정작 배우는 내용은 1900년대 초반에 프랑스 수학자가 만들고 일본인 수학자가 완성시킨 Stochastic Calculus와 불확실성 모델링에 도입할 수 있도록 식을 적절하게 변형한 경제학자들의 수학적인 연구 성과물들이다.

너무 4차원적인 예제만 든 것 같은데, 자연과학 이론이 검증되고 공학적으로 적용된 사례가 결국 우리가 평소에 쓰는 상품이라는 아주 가까운 예시 하나만 더 들어보자. 유학시절, 화학 전공 형님이 다 말라붙은 밥을 버리려는 우리를보고 “잠깐, 이상기체방정식을 적용해서…”라고 그러더니 잠시 후, 그 말라 붙은 밥이 김이 모락모락나는 밥으로 바뀌었다. 근데, 나중에 알고보니 똑같은 작업을 우리나라 유명 밥솥 회사들이 자기네 상품에 적용해서, 장시간 밥솥에 보관된 밥이 말라붙지 않도록 유지시키는 기술 특허를 내놨더라.

더 가까운 예제를 하나만 더 들면, 신축 아파트들의 Ergonomic 부엌이라는 컨셉도 인간의 동선을 넣고 시뮬레이션 모델링을 해서 최단거리 이동을 만들어 낼 수 있는 조합들을 골라낸다. 웃기게 들릴지 모르지만, 중학시절에 한 붓 그리기, 여러 점 연결하기 같은 작업 했던 내용이 이 모델에 정확하게 같은 논리로 적용된다. 이런 걸 보면, “우리 생활 속에 숨어있는 수학”이 아니라, “내가 관심없어서 몰랐던 수학”이라고 표현하는게 더 적절할 것 같다.

 

2. 통계학 렌즈로 본 세상

데이터 사이언스에 적용되는 수학과 통계학도 마찬가지다. 위에 잠깐 언급한대로 데이터 분석은 그래프를 예쁘게 그리는 거라는 정도에서 인식적 한계가 있는 사람들이 있는데, 그 분들께 필자의 석사 논문을 한번 공유해보고 싶다.

우리나라 제약업계에 공공연한 비밀은 제약사들이 유명 병,의원들에게 막대한 금액의 “리베이트”를 뿌리고 있다는 사실이다. 대놓고 우리회사 약을 처방하면 얼마만큼의 수수료를 챙겨주겠다고 나서는 경우부터 주요 고객들에게 의학 컨퍼런스를 가장한 해외여행권을 준다던가, 명절 선물이라는 핑계로 고가의 그림을 보낸다던가 하는 것 등이다. 이런 사례가 너무 많았는지 공정거래위원회가 2009년부터 단계적으로 규정을 개정해서 리베이트 관례가 많이 줄어들었다는 기사를 봤다.

이 기사를 보고 필자가 두 가지 생각을 해 봤다. 리베이트가 줄어들어서 의사들이 좀 더 소신껏 약을 처방하게 된 게 맞을까? 리베이트에 돈을 안 써도 된 상황이 온 제약사들은 경영상에 무슨 선택을 했을까?

첫번째 질문에 대한 답을 찾기 위해서 필자는 한국 제약업계가 가격 경쟁으로 움직이는 시장인지, 아니면 다른 경쟁 요소에 의해 좌지우지되는 시장인지에 대한 확답이 필요했다. 일반적으로 경제학 모델에서 가격 경쟁을 Bertrand 모델, 생산량 경쟁을 Cournot 모델이라고 하고, 좀 더 공부해보면 상품 퀄리티에 대한 경쟁 모델로 Quality competition 모델이 있다. 셋 중 어떤 모델이 더 맞을지 한국 제약회사 매출액 상위 30개 업체의 리베이트, 매출액, 상품별 매출액 등의 정보를 리베이트 규제 이전과 이후로 나눠놓고 Panel Data Regression을 했다. 보통은 산업별로 특징이 있는지를 잡아내는 변수를 하나 놓고, 그 변수가 유의미한 변수인지를 테스트하는 방식으로 진행한다.

당시 필자가 몇 줄 코드로 친 통계 분석의 결론은 (예상했던대로) 리베이트 이전의 한국 시장은 가격 경쟁 (정확하게는 리베이트 경쟁) 모델로 설명할 수 있었고, 리베이트 규제가 들어가면서 모델의 무게중심이 Quality competition으로 옮겨갔다. 한국인 입장에서 좀 자존심이 상해서 다른 선진 시장들 데이터를 찾아서 똑같은 작업을 해보니 (자존심이 두 배로 상하게도) 가격 경쟁은 우리나라 2010년 이전 데이터에만 나타나더라. 외국 초대형 제약사들은 신약 개발에 어마어마한 금액의 R&D 투자를 하고 있기 때문에, 그 중 하나가 대박이 나면 굳이 리베이트 영업을 하지 않아도 충분히 매출액 신장을 얻어낼 수 있기 때문일 것이다.

정리하면, 리베이트 규제 때문에 단순한 카피약보다는 의사들의 경험에 기반해서 좀 더 효과적인 약을 처방하는 방향으로 시장의 균형이 이동했다는 판단을 내릴 수 있었다.

두번째 질문에 대한 대답은 2010년 이후에 제약사들의 지출 내역과 투자 내역에서 나타났다. 매출액이 급격하게 줄어든 회사들은 운신의 폭이 좁아졌기 때문에 제외하고, 다른 회사들의 투자 내역을 보면 공장을 짓거나 공장 시설을 업그레이드하는데 큰 비용을 쓴 정보들을 확인할 수 있었다. 여기서도 간단한 회귀분석을 통해 가격 경쟁 -> 퀄리티 경쟁으로 이동하는 걸 인덱싱해서 한국의 상태를 그래프 상에 배치하고, 투자가 성과를 내는 시점에 어디로 이동하게 될지 방향 설정도 해볼 수 있었다.

시간에 쫓겨 한 달만에 급하게 완성했던 저 위의 석사 논문에 필자가 쓴 수학&통계학은 그렇게 많지 않다. 다만, 그런 작업을 거치면서 데이터 분석이라는건 단순히 그래프만 그리는게 아니라 “뇌피셜”을 논리와 데이터를 이용해 증명하는 작업이라는 걸 깨닫게 됐다. 그 이후로 누군가 필자에게 데이터 분석이라는건 그래프를 얼마나 설득력 있게 그리는 작업이니 사실 수학이나 통계학이 그렇게 필요하지않다고 주장하면…… 비웃는다. 안타깝다.

 

3. 데이터 사이언스로 본 세상

요즘 데이터 사이언스 공부한다는 사람들이 하는 작업들을 보면 크게 두 가지다. 하나는 K-means, KNN, Logit, SVM, PCA 같은 “이론”을 배우고 그걸 간단한 데이터에 적용해서 “몇 %만큼 맞.춘.다.”는데 초점을 맞추는 내용이고, 다른 하나는 CNN을 이용해서 이미지가 얼마나 완벽하게 인식되는지를 보고 유사한 걸 복사해내려고 몇 백만원이나 되는 고가의 수업을 찾아다니는 걸 볼 수 있다.

박사 재학시절 옆 전공에서 졸업 준비를하던 모교 과 선배 분이 “한국 사람들이 보면 수학이 약한 것 같애. 다들 Robust (엄밀함)하질 않고, 논리에 구멍이 많아.”라고 하셨는데, 비슷한 맥락에서 필자도 “한국 사람들이 깊이가 없어. 다들 피상적인 지식에 쉽게 휩쓸리는 것 같애.”라는 표현을 자주 쓰곤 한다. (솔직히 말하면 필자도 Robust 부분에서 부족함이 많은, 학자로는 낙제점인 인간이라고 생각한다.)

요즘 시장에 나온 머신러닝 수업들이 구성된 방식이나, 그런 수업들을 소비하기 위해서 찾아가는 수강생들 대부분에게서 흔히 찾을 수 있는 특징이라고 말하면, 너도 한국인이면서 너무 한국인 비하하는거 아니냐고 말하실텐가?

이미지 인식을 하는데 요즘이야 CNN으로 이미 완성된 코드가 돌아다니니 그냥 코드 복사해서 쓰면 된다고 생각하는 분들이 많겠지만, 저걸 대학 수업에서 처음 봤던 필자는 CNN 설명하는 외부 강의들을 보면서 좀 아쉬운 점이 많다. 필자가 처음 이미지 인식 과정을 공부할 때 썼던 통계 모델은 PCA였다. 데이터에서 Feature extraction을 한다고 할 때, 이미지를 255 x 255 x 255 (흑/백이면 마지막은 0/1)의 숫자 조합으로 바꾸고 그 숫자들이 몇 백장의 사진에서 모두 유사하게 나타난다면 그게 아마도 얼굴 모양, 코, 눈, 입 같은 부분의 모양일 것이다. 개중에는 눈이 동양인처럼 작은 경우와 서양인처럼 크고 둥글지만 안와상융기 때문에 안으로 쑥 들어간 것처럼 보이는 경우로 구분이 될 것이고, 또 코가 펑퍼짐하거나 한쪽으로 휘었거나 등등 여러가지 개인별 특징들 때문에 기본적인 PC값들로 잡아낼 수 없는 비공유적인 특징들이 또 뽑혀나올 것이다.

이렇게 전체적인 특징, 개인별 특징을 잡아내는 작업을 PCA로 진행하고, 예를 들어 이 사람이 동양인인지, 서양인인지 구분하는 경우, 또는 남자인지, 여자인지 구분하는 경우 등등 0/1을 놓고 Classification 작업을 할 때 KNN을 쓰곤했다. 이런 작업 전반을 CNN이라는 대형 알고리즘 하나 안에 넣어놓고 모델이 어떻게 돌아가는지를 설명하기 어렵다보니 (복잡하니 설명 못하고, Black box라서 설명 못하고, 자기도 사실 코드만 카피해와서 설명 못하고 등등) 다들 이 코드를 쓰면 92%, 95% 맞출 수 있다고 하는 결과값에만 집중하는 사태가 발생하는 것이다.

매 번 하는 이야기지만, 모델이 어떻게 돌아가는지 모르면 그냥 copy & paste 하는 인간 밖에 안 된다. 가끔 구글링하다가 보는 초보자용 Neural net 블로그를 가 보면, “내 인생 최초의 Deep learning 모델이 돌아갔다~ 만세!!!” 같은 글들을 여럿 볼 수 있다. 그들 중 과연 얼마나 많은 숫자가 자기가 복사해온 Neural net 코드를 제대로 이해하고 돌렸을지는 의문이지만.

 

나가며 – 경영학과 w/ 수학 vs. 공대 w/o 수학

지난달 수업에 경영학과 출신인 분이 한 분 오셨다. 사실 그 동안 경영학과 출신인 분이 여러번 오셨다가 힘들어하시는 모습을 많이 봐서 잘 따라오실 수 있으려나 걱정이 많았다. 수업 중반을 넘기면서 혹시 따라오기 버겁지 않으시냐고 여쭤보니, 필자가 이전에 모비 아카데미를 통해서 강의했던 “데이터 사이언스를 위한 수학&통계학” 수업을 들으셨단다. 그 때 봤던 수학들이 계속 나와서 이해를 못하고 가지는 않는데, 아무래도 더 많이 준비된 사람이 오면 더 많이 얻어갈 수 있지 않을까는 생각이 든다고 하셨다. 그래서 시간있으시면 돈 안 받을테니 1월에 한 번 더 들으시라고, 이해 안 되는 부분 있으면 너무 스트레스 받지 말고 편하게 들으시라고 그랬다.

수업 막판에, 배운 이론들이 실제 사례에 적용되는 스토리들 몇 개를 들려드리고, 논문을 하나 살짝 리뷰하면서 배운 내용이 적용되는 방식을 소개해드렸는데, 왜 자기가 코드만 돌리고 0과 1을 70%, 80% 맞추는 수업을 듣고 답답했었는지를 깨달을 수 있어서, 눈이 번쩍 뜨이는 거 같아서 좋았다고 하시더라. 전체 스토리를 한번 따라오셨으니 아마 한 번 더 수업을 들으시면 더 깊이 이해하실 수 있을 것이다.

반대로, 광고 시장에서 Last click에만 집중하는 현재의 시장이 잘못되었고, 주먹구구식이 아니라 합리적인 기준으로 광고 성과를 분배해야한다고 Shapley value를 소개했던 어느 대기업 강의에 오셨던 직급 높은 (개발자로 추정되는) 분은 그런 수학 모델을 어떻게 써먹냐고 얼굴에 비웃음을 띄우시더라. 머신러닝으로, 정확하게는 Neural net으로 이미지 인식하는건 그렇게 쫓아가며 코드 베끼는데 혈안이 되신 분이, 사실은 Neural Net 코드가 아무런 관련 없어보이는 기본 통계 모델링 기술인 PCA와 KNN을 단지 대형 모델로 바꾼거라는 걸 아신다면 어떻게 될까?

글 서두에 수포자가 생기는 이유는 수학이 필요하다고 느끼지 않기 때문이라고 그랬는데, 위의 경영학과 수강생과 대기업 개발팀 고위직 분의 사례가 딱 맞게 해당되는 것 같다. 수학이 필요하다는 걸 깨닫고 나니 필자의 수업을 다시 찾아오겠다는 생각을 하시는거고, 반대로 코드에 안주하고 있으니 자기 코드가 어떤 원리로 돌아가는지 전혀 관심이 없으신 게 아닐까?

 

2편 링크

분기별 비트코인 / 미화 선물계약

아래 상품을 2017년 12월 15일 12:00 UTC (한국시간: 오후 9시) 또는 이전에 새롭게 제공합니다:

  • 비트멕스 비트코인 / 미화 (2018년 3월 30일 만기, 선물계약 – XBTH18)

2018년 6월 29일부로 만기되는 비트코인 / 미화 선물계약 (XBTM18)도 조만간 출시 할 예정입니다.

분기별 비트코인 / 엔화 선물계약

비트멕스의 비트코인 / 엔화 (2017년 12월 29일 만기, XBJZ17) 선물계약 만료 이후, 새로운 분기별
비트코인 / 엔화 선물계약 출시 계획은 없습니다. 향후, 비트코인 / 엔화 무기한 스왑계약을 출시 할 예정입니다.

분기별 알트코인 선물계약

아래와 같이 신규 분기별 계약들이 오는 2017년 12월 15일 12:00 UTC (한국시간: 오후 9시) 또는 이전에 출시됩니다:

  • 비트멕스 이더리움 / 비트코인 (2018년 3월 30일 만기, ETHH18)
  • 비트멕스 대시 / 비트코인 (2018년 3월 30일 만기, DASHH18)
  • 비트멕스 라이트코인 / 비트코인 (2018년 3월 30일 만기, LTCH18)
  • 비트멕스 모네로 / 비트코인 (2018년 3월 30일 만기, XMRH18)
  • 비트멕스 리플 / 비트코인 (2018년 3월 30일 만기, XRPH18)
  • 비트멕스 지캐시 / 비트코인 (2018년 3월 30일 만기, ZECH18)

참고로, 모든 알트코인에 대한 메이커 / 테이커 수수료는 다음과 같이 변경 될 예정입니다:
-0.05% / +0.25%.