총 세 편의 글에 걸쳐 데이터에 관한 글을 썼다. 간단히 요악하자면 대략 아래와 같다. 

 

1. 우리가 ‘데이터’라 통칭하는 것이 사실 종류도 성격도 다 다른 것들이다. (그래서 어렵다)

2. 따라서 우리가 데이터를 왜 수집하고, 어떻게 쓰려하는지 ‘목적성’을 명확히 해야 한다.

3. 그리고 그 목적에 따라 데이터가 계속 ‘축적’될 수 있도록 만들어야 한다.

 

오늘은 여기서 세 번째 부분에 대해 좀 더 이야기를 해보려 한다.

 

 


 

 

‘머니볼’은 데이터의 중요성에 관한 영화인가?

 

브래드 피트 주연의 ‘머니볼’이란 영화가 있다. 오클랜드 애슬래틱스라는 영세(?)한 메이저리그 구단이 데이터를 활용해 승리를 만들어내는 내용이다. 이 영화는 흔히 빅데이터의 중요성을 언급할 때에 자주 예시로 등장한다. 야구 같은 스포츠 경기에서도 데이터를 도입하면 승리를 할 수 있다는 뜻일 거다. 

지금 관점에서 보면 너무 뻔한 얘기다. 어느 스포츠 종목이든 이제 데이터 분석은 필수가 됐다. 하지만 머니볼을 잘 보면 이 영화에서 얘기하는 건 데이터의 중요성이 아니다. 야구의 본질에 관한 얘기다.

야구 경기뿐 아니라 어느 스포츠 경기에서든 데이터는 이미 쌓여 있었다. 데이터를 활용한 것도 애슬래틱스가 처음이 아니다. 애슬래틱스의 꼰대 스카우터 역시 모두 데이터를 보고 있다. 다만 그들은 좋은 선수, 이른바 ‘파이브 툴 플레이어’를 찾아내기 위해 데이터를 본다. 일반적인 스포츠 경기에서도 상대의 전력을 분석하기 위해 데이터를 활용한다.

하지만, ‘머니볼’에서 애슬래틱스의 단장(GM)인 빌리 빈과 피터는 야구를 1루를 진루하는 게임이라 봤다. 그렇다면 일반적으로 말하는 파이브 툴 선수가 아닌, 1루를 더 진루할 수 있는 선수를 찾는 데이터가 필요하다. 많은 데이터를 빠르게 분석할 수 없을 땐 불가능했던 일이다.

 

 

머니볼의 데이터 활용법. 데이터의 목적성이 명확해야 이기는 데이터를 찾을 수 있다.

 

 

우리가 시장에서 승리하기 위한 공식은 무엇인가? 데이터가 없을 때는 ‘감’으로 찾아내야 했던 게임의 법칙이 데이터 때문에 바뀌었을 수 있다. 그걸 모른다면 ‘양키스’도 ‘애슬래틱스’ 같은 팀에 질 수 있다.

이제 달라진 게임의 법칙에 따른 데이터를 찾아야 한다..

 

 


 

 

승리를 위한 데이터에 파이프라인 놓기

 

연재 내내 데이터의 목적성에 대해서는 지겹도록 이야기한 것 같다. 많이 모은다고 좋은 데이터가 아니다. 큰 노력 없이도 빅데이터가 모일 수 있는 환경이라면 분석하는 데 물론 도움이 되겠지만, 빅데이터가 있어야만 좋을 것이란 믿음은 허상이다. 위에 언급한 대로 우리의 승리를 위한 데이터만이 의미가 있다.

앞서 살펴봤듯 데이터는 발생하는 곳(외부, 내부)도 다양하고, 또 형태(정형, 비정형)도 제각각이다. 그렇기에 필요한 데이터가 발생하는 곳에 파이프라인을 대고, 우리가 원하는 결과로 계속 쌓이도록 만드는 것이 중요하다. 그런 이질적인 데이터를 어떻게 하나로 모을 수 있느냐가 중요한 포인트다.

 

 

목적에 부합하는 이질적 데이터를 하나로 모으는 것이 핵심이다.

 

 

대체로 우리가 알고 싶은 핵심 데이터는 고객의 성향에 해당한다. 고객이 어떤 성향을 갖고 있는지는 직접 물어본다고 알 수 있는 것도 아니고(본인도 잘 모른다), 단편적인 정보로 추측하기도 어렵다.

모든 고객은 다양한 면을 가지고 있다. 이 고객은 구매력이 있는가? 라는 것과, 우리 브랜드(제품)에 호감을 갖고 있는가? 는 다른 문제다. 또 그런 호감의 요소가 다른 경쟁 제품에도 있는 것인지 우리에게만 있는 요소인지도 중요하다. 이런 데이터를 종합적으로 파악하려면 한 곳에만 파이프라인을 대서는 소용이 없다. 나이나, 성별 등 데모그래픽에 의해 추측하는 것은 지극히 원시적인 방법이다. 

또 하나 중요한 것은 우리가 결국 얻고자 하는 결과다. 막연히 매출이라고 규정할 수도 있지만, 매출 역시 ‘방문자 X 구매율 X 객단가’로 쪼개서 세부적으로 볼 수 있다.

방문자(또는 방문율)를 어떻게 끌어올릴 것인가? 구매율은 어떻게 높이나? 고객이 추가, 교차 구매를 하도록 하려면 어떻게 해야 하나? 등의 질문이 필요하고, 더 세부적으로 들어가다 보면 우리가 놓치고 있었던, 또 가장 극적인 효과가 나타날 수 있는 요소가 발견된다. 이런 질문을 통해 어느 고객 성향을 알아야 하는 지도 답을 찾을 수 있을 것이다.    

 

 

회사의 고민과 고객 성향에 해당하는 데이터를 매칭시켜 승리를 위한 데이터는 무엇인지 찾아낸다.

 

 

하지만, 여전히 어렵다. 여기서 하고자 하는 이야기는 어떤 ‘답’이 있다는 것이 아니다. 어차피 각자의 답은 다를 수밖에 없으니 올바른 질문을 하는 법을 찾아야 한다는 것이다. 나에게 어떤 데이터가 필요한지를 알면 찾는 방법에 대한 아이디어에도 좀 더 쉽게 접근할 수 있다. 

 

당신의 진짜 실수는 대답을 잘못 찾은 게 아냐. 자꾸 틀린 질문만 하니까 맞는 대답이 나올 리가 없잖아. ‘왜 이우진은 오대수를 가뒀을까?’가 아니라 ‘왜 풀어줬을까?’란 말이야.

영화 <올드보이> 중 이우진의 대사

 

 


 

 

시중에 나와 있는 책이나 담론들은 대부분 빅데이터가 얼마나 중요한지, 빅데이터로 무엇을 할 수 있는지, 빅데이터 분석가가 되려면 어떻게 해야 하는지 등을 다루지만, 정작 빅데이터를 가지고 시작하는 기업은 많지 않다. 설령 그런 데이터가 있다 해도 정말 이 데이터가 마케팅에 도움이 되는지 확신하기 어렵다. 

나에게 필요한 데이터가 무엇인지 알아내는 데 성공했다면, 그런 데이터를 일부라도 얻을 수 있는 방법과, 해당 유형의 고객들을 확보할 수 있는 방법을 고민해 보자. 찾아보면 생각보다 데이터를 얻을 수 있는 채널이나 벙법은 꽤 많이 있다. R이나 파이썬을 배우지 않아도 쓸 수 있는 툴도 많이 있는 편이다. 

아쉽지만, 데이터에 관한 좀 더 깊은 고민은 차후를 기약하도록 하고, 이제 스토리 부분으로 넘어가도록 하자.

P.S. 혹시 영화 머니볼을 아직 못 보신 분이라면 꼭 보길 바란다. 그리고, 이미 보셨다면 한번 더 보시길! 

 

 

Ryan Choi님이 브런치에 게재한 글을 편집한 뒤 모비인사이드에서 한 번 더 소개합니다.