NHN(www.nhncorp.com 대표 김상헌)이 지난 6일 분당 본사에서 빅데이터(Big Data)를 주제로 사내 소통을 위한 커넥트 데이 행사를 개최했습니다.

국내 정보기술(IT) 업체로는 검색포털 사업자, 그 중에서도 NHN이 빅데이터와 가장 연관이 클 텐데요. 그간 빅데이터에 대한 말을 꺼내지 않았을 뿐 NHN은 빅데이터 자체라고 해도 과언이 아닙니다.

NHN에 따르면 포털 네이버 검색창에 새롭게 입력되는 질의어(UQC, Unique Query Count)가 하루에 2000만건 이상 발생되고 있습니다. 이에 따라 네이버가 하루에 처리해야 할 문서의 양은 약 130억건, 하루에 발생하는 검색로그는 3테라바이트(TB)라고 하네요.

이 같은 엄청난 데이터를 정렬하고 이를 재조합해 가치를 창출해내기 위해서는 내부에서 치열한 문제 해결의 과정이 있었을 텐데요. 이날 이러한 내용이 발표됐습니다.

◆빅데이터, 데이터의 실체적 활용이 중요

이날 NHN의 커넥트 데이에는 이윤식 검색본부장<사진>과 함께 지난 6년전부터 검색 품질 고도화를 위해 대용량의 데이터, 최근 ‘빅데이터’라 일컫는, 정보들을 체계적으로 처리하고 분석해온 데이터정보센터의 김유원 박사, 비즈니스플랫폼개발센터의 김동욱 박사(당시 로그모델링팀장)도 발표자로 나섰습니다.

발표자로 나선 3인은 빅데이터를 목적 아닌 수단으로 봤습니다. 데이터 자체로는 큰 의미가 없고 이를 실체적으로 활용하는 것이 중요하다는 말인데요.

이윤식 검색본부장은 “우리의 빅데이터 시스템, 즉 로그 시스템이 성공적으로 안착할 수 있었던 이유는 명확한 문제 인식과 이를 해결하기 위한 구체적 목표를 향한 노력이 뒷받침되었기 때문”이라며 “이러한 데이터 활용에 대한 성공 경험을 기반으로, 앞으로는 데이터로부터 새로운 가치를 창출해 나갈 계획”이라고 밝혔습니다.

◆NHN, 2006년부터 데이터에 대한 본격적 고민 시작돼

‘빅데이터’라는 말이 없던 2006년, 그 당시 NHN은 데이터에 대한 본격적인 고민을 시작합니다. 데이터 활용에 대한 내부의 요구가 많아졌습니다. 특정한 칼럼(데이터)의 값들을 하나로 묶는 그룹바이(Group by) 작업이 내부에서 쏟아졌는데요. 데이터 정렬과 재조합의 필요성이 제기된 것이죠.

NHN은 2006년 이전까지 그룹바이에 강점을 보인 상용솔루션을 쓰기도 했으나 당시 기술력으로는 포털 네이버의 데이터를 처리하기엔 역부족이었다고 이 본부장은 설명했습니다. 데이터 로딩속도가 문제였죠. 이 부분의 개선을 위해 NHN은 ‘네뷸라(Nebula)’ 시스템을 개발합니다.

참고로 NHN에서 하둡(hadoop)을 전담하는 조직이 네뷸라였는데요. 하둡은 대용량 데이터 처리를 위해 대규모 분산처리를 지원하는 프레임워크입니다. 당시 NHN은 데이터 가공 없이 분산시스템에 넣고 풀스캔하는 방식으로 그룹바이를 처리했습니다.

그러자 데이터의 단절이 문제가 됐고 데이터의 연속성 확보를 위해 보완의 필요성이 제기됐죠. 이에 NHN은 한게임을 테스트베드로 삼아 쿠바(Cuba)라는 시스템을 개발했고 이용자 요구에 따른 실시간의 순차적인 정보(시퀀스) 분석을 위해 메조(Mezzo)라는 로그시스템 개발에까지 이르게 됐습니다.

◆2008년 데이터 활용에 눈뜨다 “가치를 만들어라”

현재 메조라는 로그시스템에는 하루 3테라바이트(TB)의 로그가 쌓입니다. 2008년 당시엔 수백 기가바이트(GB) 수준이었는데요. 이 본부장은 “그때부터 데이터를 모아서 가치를 만들어나가기 시작했다”고 말했습니다.

이러한 고민에 대한 해결이 대용량 데이터 분석기술인 파스(FAS, Feedback Analysis System)로 나타납니다. 2010년 검색 품질을 개선하기 위해 적용한 기술입니다.

파스는 게임이론에서 시작됩니다. ‘두 명의 이용자가 경쟁하면 누가 더 실력이 뛰어날까’를 판별할 수 있게 수학적으로 풀어놓은 모델인데요. 간단한 모델이지만 서비스에 적용해 한번 돌리려면 3~4일이 걸렸다고 하는데요. 이후 1년반에 걸쳐 실제 서비스에 적용한 가능한 수준으로 개선을 거칩니다. 현재 NHN은 네이버 검색결과에 FAS를 적용, 랭킹 요소를 부여하고 있습니다.

네이버가 빅데이터를 분석해 실제 서비스에 적용한 사례로는 뮤직 서비스의 음악 추천 기능인 라디오 서비스, 자동완성·연관검색어·실시간급상승검색어 등의 검색어 추천, 사용자그룹별 검색어 등이 있습니다.

◆빅데이터 가진 NHN, 빅브라더 될까

빅브라더(Big Brother)는 조지 오웰의 소설에 나오는 감시자입니다. 정보 독점을 기반으로 사회를 통제하고 관리하는 권력을 뜻하는 말인데요. 최근 구글이나 페이스북 등의 개인정보 활용 때문에 빅브라더 논란이 제기되는 가운데 사내에서도 이와 관련된 질문이 나왔습니다.

이날 질문자는 “페이스북은 개인정보를 활용해 마케팅에 쓰고 연락이 10년 동안 안된 친구들도 막 알려주는데 개인정보침해 때문에 두려운 점도 있다. 우리가 서비스 제공하는 것 중에 사용자가 누군지 알고 활용하는 사례가 있는지 궁금하다”고 말했는데요.

이에 대해 김유원 데이터정보센터 박사는 “네이버는 개인을 식별할 수 있는 정보를 사용하지 않는다”며 “유사 서비스로 사용자그룹별 인기검색어가 있을 수 있는데 기본적으로 쿠키정보를 활용하기 때문에 개인정보는 침해하지 않는다”고 답했습니다.

이어 “개인정보에 대해서는 엄격한 기준을 가지고 있고 그런 서비스 기획은 절대 하지 않는다”고 김 박사는 강조했는데요.

이처럼 NHN의 입장은 단호합니다. 하지만 이 부분은 NHN의 입장이 어떻든지 사용자의 입장에서는 불편을 야기할 수도 있는 문제입니다. 이를테면 사용자의 쿠키정보(웹페이지 접속 통계정보)가 활용되는 것에 불만을 가지는 고객도 있기 때문이죠.

김동욱 비즈니스플랫폼개발센터 박사는 빅데이터를 활용한 광고 타깃팅 상품 여부에 대한 질문에서 “고객들은 내가 뭐를 좋아하지 않을까 (추천하는) 그것마저도 싫어한다”며 “내가 한 일을 너는(NHN) 어떻게 아는 지도 부담스러워한다”고 말했습니다.

김 박사는 또 “그 부담을 넘어서는 밸류(가치)를 제공하고 나를 알아보는 게 별거 아니었어하는 사회적 인식이 확산되면 (광고 타깃팅 상품은) 그때 간다”며 “지금은 요원한 일”이라고 덧붙였습니다.

2012/12/10 08:44 2012/12/10 08:44

스마트폰게임 흥행 여부가 데이터와의 싸움에 달렸다는 사실을 알고 계시나요. 그만큼 데이터 분석을 통한 게임의 유지·보수·업데이트가 중요하다는 말입니다.

실제로 징가 등 해외 유수의 게임업체는 일찍이 데이터 분석에 눈을 떴습니다. 최근 들어 국내 게임업계도 데이터 분석에 관심을 갖기 시작했다고 합니다.

데이터 분석 전문업체인 콘타젠트(www.kontagent.com)의 제이슨 리(Jason Lee) 수석 엔지니어<사진>가 지난 9일 서울 삼성동 코엑스에서 열린 ‘스마트&소셜게임 파티’를 통해 게임 애플리케이션(앱) 분석 관련 발표를 진행했습니다.

발표를 통해 제이슨 리 수석 엔지니어는 “부분유료화 게임이 많아지면서 데이터 분석이 중요해졌다”고 강조하더군요.

유료 게임의 경우 구매 즉시 수익이 되지만 부분유료화 앱은 구매 이후 이용자를 앱 내 유지시켜야 매출이 발생합니다. 게임 앱 데이터 분석의 목적은 이용자들이 가능한 오래 앱 내에 잡아두고 최대한 지출이 발생하게끔 하는 것이죠.

한 고객이 평생 이용하는 금액(가치)의 합계를 고객평생가치(Lifetime Value, LTV)라고 부릅니다. 마케팅에서 중요한 부분인데요. 게임 앱에서도 마찬가지입니다. 게임 앱의 이용자가 소비하는 금액의 총합인 LTV를 최대화할 수 있는 것이 데이터 분석입니다. 앱 수명 전체에 걸친 이용자 데이터를 분석해야겠지요.

이용자의 데이터 분석을 거치면 게임 앱 운영에 있어 새로운 길이 열리게 됩니다.

예를 들면 데이터 분석에 따라 전 세계 지역에서 주요 매출 발생지역이 어딘지 알 수 있겠죠. 이용자의 재방문율을 보고 마케팅 비용을 지출할 수 있습니다. 적은 마케팅 비용으로 최대의 효과를 누릴 수 있게 되는데요.

그렇다면 고객인수비용(Cost Per Install, CPI)을 최소화하면 성공적인 게임 서비스가 가능할까요. CPI는 게임 앱 설치 건당 소요되는 비용입니다.

이 엔지니어는 이 부분에서 업체들이 착각을 많이 한다고 지적합니다.

그는 “비싼 비용으로 고객을 끌어들여도 (그 비용보다) 고객이 돈을 더 쓰면 성공적”이라고 설명합니다. 비용 최소화에 한정된 시선에서 벗어나 보다 폭넓게 시장을 보라는 당부로 해석되는데요. 앱의 특성과 이용자 성향에 따른 마케팅이 중요하다는 말이겠죠.

그는 또 “이용자의 게임 내 특정 액션을 관찰하라”고 강조했습니다.

예를 들면 이벤트를 진행했을 때 이용자의 반응이 되겠죠. 이벤트를 보고 게임에 들어온 이용자가 실제 고객이 되려면 이러한 데이터 분석과 게임의 개선이 중요합니다.

이에 이 엔지니어는 이용자를 실제 고객으로 만드는 과정을 말하는 마케팅 용어인 퍼넬(Funnel)을 꺼내기도 했습니다. 수익창출 단계에서는 결제, 즉 아이템을 구매하는 시점에서 이용자가 언제 빠져나가는 지 봐야 한다는 설명인데요.

그는 “모든 것을 살피고 측정하라”고 거듭 당부했습니다. 즉 앱의 버전, 지역, 장비 그리고 운영체제(OS) 버전에 따른 분석이 필요하다는 입장인데요. 특히 안드로이드의 경우 단말기가 파편화돼 보다 많은 분석이 필요하다고 강조했습니다.

이 엔지니어는 또 “(게임 론칭 후) 1일, 7일, 30일째 유지율을 측정하는 것이 굉장히 중요하다”며 “DAU(일간활동이용자)/MAU(월간활동이용자) 비율이 중요하다. 이것은 이용자가 어느 정도 게임을 흥미진진하게 즐기는지 보여주는 지표”라고 말했습니다.

그는 데이터 분석 시 업체가 주의할 점도 전했습니다. 비 정상적인 게임 이용에 따른 데이터 측정의 오류 때문입니다. 아이폰 이용자가 탈옥(Jailbrake) 후 불법 앱을 이용한다면 실제 매출이 없는데도 매출 발생이 기록될 경우가 있습니다. 업체가 이 데이터를 믿고 게임 앱을 개선한다면 문제가 되겠죠.

마지막으로 이 엔지니어는 “포착되지 않을 것들은 분석할 수 없다”고 말했습니다. 역시나 데이터 수집과 분석을 강조한 말인데요. 그는 로그파일이라도 있으면 분석하라고 조언했습니다. 많은 교훈을 얻을 수 있다더군요.

2012/04/10 12:50 2012/04/10 12:50