시각적 분석 관점에서 태블로를 사용하는 방법

소개

안녕하세요. 시각적 분석 관점에서 태블로를 사용하는 방법을 주제로 포스팅하게 된 정동욱입니다.

축구와 데이터를 사랑하며, 핏투게더에서 태블로를 활용한 데이터 시각화를 하고있습니다.

제가 하는 일과 그 특징에 대하여 알려드리고, 실제 진행했던 프로젝트의 예시를 통해 저의 방식을 소개해드리겠습니다.

하는 일

데이터 시각화를 통해 다음과 같은 일을 할 수 있습니다.

  • 다양한 부서의 데이터 기반 의사결정을 지원합니다.
  • 서비스 축적 데이터(주로 GPS 기반 움직임 데이터)를 연구, 분석하여 새로운 가치를 창출합니다.
  • 고객의 서비스 이용 패턴을 모니터링하고, 세그먼트 별 마케팅 전략을 수립합니다.
  • 측정 장비 및 분석 알고리즘의 정확성을 검증합니다.

데이터의 특징과 시각화의 중요성

핏투게더에서는 웨어러블 장비로부터 발생하는 운동선수의 움직임 데이터를 수집하여, 활용 가치가 있는 정보를 뽑아내 고객 구단에게 전달하는 OHCOACH(오코치)라는 스포츠 퍼포먼스 데이터 분석 솔루션을 제공하고 있습니다.

스포츠 사이언스와 기계공학, 이 2가지가 주요 도메인입니다.

단순히 이벤트 발생여부를 수신하여 카운트하는 것이 아니라, 기기로부터 발생한 시점 별 데이터로부터 복잡한 처리과정을 거쳐 유의미한 정보를 얻어내고, 그것을 다시 집계하여 여러가지 수치를 산출합니다.
(시간대 별 이동거리, 속도 별 이동거리, 전력질주 횟수 등)

따라서 이 모든 과정과 관련지식을 한 사람이 완벽히 파악하는 것은 상당히 어려운 일입니다. 공동의 목표를 향해 나아가기 위해서는 데이터 시각화를 통해 구성원들의 이해를 돕고 관점을 통일시키는 것은 중요한 일입니다.

핏투게더의 데이터분석

핏투게더에서는 구성원들이 대시보드를 함께 보면서 분석합니다. 다양한 분야의 전문가들이 같은 데이터를 다른 시각으로 바라볼 수 있습니다. 각자가 이해하고 발견한 인사이트를 나누면 더욱 합리적인 의사결정에 도달할 수 있습니다.

대시보드에서 중요시 하는 것

제가 대시보드를 만들 때 고려하는 것은 크게 2가지 입니다.

  • 특정 프로젝트에서 의사결정을 지원하기 위한 Key Metric이 무엇인지
  • Key Metric에 대한 의심과 궁금증이 발생할 경우 그것을 어떻게 해소할 수 있을지

노하우

그렇다면 제가 중요시하는 요소들을 대시보드 안에 어떻게 녹여낼 수 있을까요.
이해하기 어려운 데이터를 최대한 직관적으로 표현하기 위해 제가 사용하는 방법은 다음과 같습니다.

  • 히스토그램과 통계량을 함께 활용하기
  • 탐색적 분석을 위한 대시보드 만들기
  • 나란히 표현하기

직접 수행한 프로젝트 대시보드의 일부를 가져왔기 때문에, 프로젝트 자체에 대해서는 간략하게 설명만 드리고 주요 변수는 알아볼 수 없게 처리 한 점 양해를 부탁드립니다.

1. 히스토그램과 통계량을 함께 활용하기

히스토그램은 데이터의 분포를 가장 빠르게 확인하고 가장 직관적으로 이해할 수 있는 방법입니다. 그렇기 떄문에 Tableau Prep이나 Kaggle 등 많은 곳에서 데이터를 간략하게 표현하기 위해 이 방식을 선택한 것을 찾아볼 수 있습니다.

Tableau Prep

Kaggle

하지만 히스토그램만으로는 충분하지 않습니다. 데이터를 대략적으로 파악할 수는 있지만, 의사결정을 대략적인 정보만으로 내릴 수는 없습니다. 데이터 기반 의사결정에는 명확한 근거가 필요하기 때문입니다. 이 점을 보완하기 위하여 평균이나 표준편차와 같은 중요한 통계량을 함께 표시합니다.

히스토그램과 통계량을 함께 확인하면 데이터에 대한 정성적, 정량적 파악을 동시에 할 수 있고, 이는 더 확신에 찬 의사결정으로 이어집니다.

위 그림은 운동선수의 특정 움직임 패턴을 분석한 결과의 일부입니다.

위 그림은 기기의 미세한 움직임을 탐지하기 위한 기준을 잡는 프로젝트의 일부입니다. 매개변수로 속도를 선택하면, 얼마큼의 데이터가 그 범위에 속하는지 확인할 수 있습니다. 빈도 자체가 너무 적어 확인하기 어려운 경우가 있어서 파레토 차트의 형태와 누적백분위를 함께 표시하였습니다.

2. 탐색적 분석을 위한 대시보드 만들기

저는 어떤 값을 뽑아내면 과연 그것이 올바른 값일지 항상 의심합니다. 데이터가 잘못되진 않았는지, 의도한 대로 집계가 되었는지, 전처리는 제대로 되었는지 등을 확인하고 싶은 마음이 듭니다.

그래서 의사결정을 위한 Key Metric이 나열된 메인 대시보드를 보조하는 용도로, 탐색적 분석을 위한 대시보드를 하나 더 만들기도 합니다.

첫 번째로는 분석가 스스로 탐색적 분석에 이용하기 위함입니다. 데이터를 다각도로 살펴보면서 여러가지를 확인할 수 있습니다.

두 번째로는 의사결정자의 데이터 파악을 돕고 궁금증을 해소해주기 위함입니다. 전처리와 분석을 하는 자신은 당연히 데이터를 잘 파악하고 충분히 많은 인사이트를 도출할 수 있습니다. 하지만 (대부분의 경우) 항상 바쁜 의사결정자에게 이를 신속하고 신뢰감있게 전달하는 것은 또 다른 문제입니다.

용도 1 : 데이터 자체의 오류가 없는지 확인

어떤 데이터들이 모여서 하나의 단위가 되고 집계되는지 두 눈을 통해 확인할 수 있습니다.

위 그림에서는 이미 알고있는 포지션이 다른 두 선수의 데이터를 확인합니다. 데이터의 범위, 공/수 방향의 비율, 선수에 대한 사전 지식을 조합해보면 데이터 자체가 올바르다는 것을 확인할 수 있습니다.

용도 2 : 전처리 알고리즘의 오류가 없는지 확인

여러 움직임의 패턴을 겹쳐서 확인해보니 분석을 위한 전처리 과정에서 미처 고려하지 못한 예외상황이 있었습니다. 시각화를 통해 오류를 발견하고 이를 수정 할 수 있었습니다.

용도 3 : 조건별로 패턴이 잘 구분되었는지 확인

움직임 데이터에 대한 속력(위)과 가속력(아래) 데이터를 함께 보면서 패턴이 잘 나뉘었는지, 어떤 차이가 있는지 확인 할 수 있습니다.

  • 패턴1 : 찾고자 하는 이상적인 패턴
  • 패턴2 : 감속하는 부분 존재 (가속이 0 이하로 내려가며 푸른색으로 표시)
  • 패턴3 : 감속하는 부분 존재하며 지속적으로 기준속도 이상으로 움직임

3. 나란히 표현하기

태블로에서는 하나의 평면에 손쉽게 여러개의 차원을 나타낼 수 있습니다. (좌표, 이중축, 크기, 색상, 텍스트 등) 하지만 사람의 인식 능력에는 한계가 있으므로 많은 차원을 한꺼번에 표현하면 작성자가 아닌 사람에게는 직관적이지 않을 수도 있습니다.

검증 작업에 많은 정보가 필요한 경우, 그래프를 나란히 배치하면 데이터를 이해하기 쉬워집니다.

위에서 자연스럽게 사례들이 나왔지만 하나 더 보여드리겠습니다.

미세한 움직임을 감지하는 API의 정확성을 검증하는 작업입니다. 좌상단에는 시간별 속력이 나타나고, 좌하단에는 시간별 움직임 여부(움직이면 푸른색, 정지하면 노란색)가 나타납니다. 붉은 세로선은 현재 우상단 화면에 보여지는 시점을 가리킵니다.

붉은 세로선과 우측 지도 내 점들의 움직임을 참고하면, 현재 움직이고있는 기기는 속력이 들쭉날쭉하며 움직임 감지여부도 확인되고있습니다. 반면 나머지 2개의 기기는 속력도 0에 가깝고 움직임도 감지되지 않습니다.

이렇게 데이터에 대한 궁금증이 해결된 다음에는 수치를 이해하고 그것에 집중할 수 있게 됩니다.

적용하기

어떤 한 축(예를 들면 시간)을 따라 값의 변화를 확인하는 것이 중요한 경우, 소개드린 방법을 적용해보는 것도 나쁘지 않을 것 같습니다.

  • 주식
  • 매출
  • 소비자 행동 패턴
  • 이벤트 발생 등

마무리

저는 호기심이 많습니다. 현재 저의 일을 사랑하지만, 다른 도메인의 현업자분들이 어떻게 일하는지도 궁금합니다. 태블로위키에서는 간접 경험을 통해 그러한 갈증을 해결 할 수 있습니다.(한국어라는 엄청난 장점!) 제가 태블로위키의 글을 흥미롭게 읽어왔던 것처럼, 제 글을 흥미롭게 읽어주신 분이 한 분이라도 계신다면 저에겐 귀중한 경험이 될 것 같습니다.

태블로 위키, 태블로 퍼블릭 혹은 공식 도움말, 유튜브 등 다양한 소스를 통해 도움을 받고 있습니다. 앞으로도 계속해서 다양한 소스를 통해 배워나갈 예정이고, 언젠가 유익한 내용을 공유드릴 기회가 다시 찾아왔으면 좋겠습니다.

감사합니다.

댓글 남기기

태블로위키만의 새로운 소식, 놓칠 수 없겠죠?