안녕하세요, 이번 포스팅에서는 데이터의 관점으로 2020 도쿄올림픽을 살펴보고자 합니다.
팬데믹 상황으로 인해 2020 도쿄올림픽 개최여부에 대해 논란이 많았습니다만, 1년 개최 연기라는 초강수를 두면서 2020 도쿄올림픽을 진행하게 되었습니다.
도쿄올림픽 개최 직전까지만 해도 여론이 좋지만은 않았는데요. 막상 올림픽이 시작 되니 올림픽에 출전한 선수들이 멋진 경기력을 보여주면서, 각 국가와 선수들을 열렬히 응원하는 분위기로 바뀌었었습니다. 여러 화젯거리와 이슈를 몰고 오면서 무더위를 시원하게 날려준, 2020 도쿄올림픽을 데이터를 통해 색다른 시각으로 바라보려고 합니다!
데이터 출처
도쿄올림픽 공식 홈페이지에 <올림픽 메달집계> 사이트에서 IMPORTHTML 함수를 이용하여 데이터를 수집하였습니다.
https://olympics.com/tokyo-2020/olympic-games/ko/results/all-sports/medal-standings.htm
또한, 아래 Kaggle 상에 업로드 되어있는 데이터 또한 다운로드 받아 활용하였습니다.
시각화 주제선정 및 과정
우선 시각화 주제를 선정하게 된 과정을 설명드리고자 합니다.
1. 해당 시각화를 통해 표현하고 싶은 주제 선정
‘도쿄올림픽’이라는 키워드를 떠올렸을 때, ‘무엇이 가장 궁금할까?’ 라는 생각에서 출발하였습니다.
아래와 같이 국가별 메달 순위표가 가장 먼저 떠오르기 마련인데, 이를 조금은 다른 방식으로 보여줄 수 있을지 고민하였습니다. 예를 들어 국가별로 총 몇 개의 종목에 참여하였고, 총 몇 명의 선수가 참여하였는지 등도 함께 알 수 있으면 좋으리라 생각하였습니다.
2. 데이터를 통해 도출할 수 있는 인사이트
다음으로, 수집한 데이터를 살펴보면서 의미 있는 해석을 도출하려고 하였습니다.
첫 번째로 종목별 참여 선수 리스트를 보면서, 종목별 참여 비중을 나타내면 좋을 것이란 생각이 들었습니다.
두 번째로 대륙별/국가별 획득한 메달 갯수를, 테이블 리스트 형식이 아닌 다양한 차트를 활용하여 보여주면 좋으리란 생각이 들었습니다.
3. 대시보드 구성 및 디자인
마지막으로, 대시보드 구성방법 및 디자인 측면입니다. 시각화 고민 과정 속에서 여러 개의 워크시트가 담길 것으로 예상되었고, 스토리 형식이 아닌 하나의 대시보드에 담고자, 긴 세로 형식으로 구성하였습니다.
또한, 2020 Tokyo Olympic Sport Pictogram Usage Guidelines 파일을 보면서, 엠블럼 컬러인 Blue 계열 컬러를 사용하기로 결정 후, 아래 링크에서 Color Palettes 중 Blue 계열인 Facebook theme을 선택하여 컬러를 구성하였습니다.
https://www.color-hex.com/color-palettes/popular.php
위 프로세스를 정리하여 설명드리면, 아래와 같습니다.
- 해당 주제 및 데이터를 통해 무엇을 말하고자 하는지 / 어떤 뷰로 바라보고 싶은지 살펴보기
- 수집한 데이터에서 도출 가능한 인사이트가 무엇인지 살펴보기
- 대시보드 구성 및 디자인 측면에서 기준 및 원칙 정하기
대시보드를 만드는 시각화 작업 시, 고려해야 하는 요소들이 정말 다양하게 있습니다. 이때, 본인만의 프로세스 및 기준을 중심으로 진행한다면, 조금 더 효과적으로 시각화 작업이 가능하기에 위 과정을 공유드렸습니다!
대시보드 분석
위 대시보드에서 내용을 하나씩 짚어보면서, 몇 가지 방법 및 Tips에 대해 공유드리겠습니다.
1) # of Olympic Participating Countries
2020 도쿄올림픽 개최를 앞두고 불참을 선언한 나라들이 있었는데요. 총 206개국이 참여했다는 사실과 더불어, 각 참여국 별로 종목별/선수별 숫자를 매개변수를 통해 확인할 수 있습니다.
종목별(Discipline) 기준으로 일본 → 미국 → 호주 → 중국 → 프랑스 순으로 많은 종목에 참여하였고, 선수별(Athletes) 기준으로 미국 → 일본 → 호주 → 중국 → 독일 순으로 많은 선수들이 참여하였습니다. 이를 통해 참가종목이 많을수록 참여선수도 많아짐을 아래 데이터를 통해서도 확인 가능합니다.
2) # of participating Athletes
2020 도쿄올림픽에 참여한 전체 11,085명에 대한 정보와 더불어, 각 종목에 참여한 선수들의 숫자를 버블차트를 통해 확인할 수 있습니다. 버블 위에 마우스를 올려두면, 각 종목에 대한 전체 참여선수 / 남자 선수 / 여자 선수 숫자 또한 확인할 수 있습니다.
3) 2020 Tokyo Olympic Medals
이번 올림픽에서 획득 가능한 전체 메달 숫자와 더불어, 각 국가별 획득한 메달을 롤리팝 차트로 구성하였습니다. 일반 막대차트에 비해, 롤리팝 차트로 구성한다면 국가별 획득한 메달 갯수에 대한 분포도 확인 시, 조금 더 가시성을 확보할 수 있으리라 생각하였습니다.
아울러, 각 나라를 클릭할 때마다 획득한 총 메달 갯수, 금/은/동메달 갯수, 그리고 선택한 나라의 위치를 표현하도록, 대시보드 > 동작을 통해 각 시트를 연결해두었습니다.
4) 대륙별/국가별 MEDALS (Sunburst 차트)
위 영상에서 왼쪽 하단에 Sunburst 차트가 구성되어 있습니다. 각 대륙별로 획득한 메달 갯수와 더불어, 각 대륙에 속한 나라들의 획득한 메달 갯수를 볼 수 있도록 구성하였습니다.
Sunburst 차트의 경우, 2020.4 버전에서 <맵에서 다중 마크 계층 지원 >기능이 추가되면서 구현 가능하게 된 차트이기에, 차트를 만드는 방법에 대해서도 간략히 다뤄보도록 하겠습니다.
(*2020.4 버전 업데이트 기능 관련하여 자세히 알고 싶으시다면, 아래 포스팅을 참고해보세요! https://tableauwiki.com/tableau-bubble-chart-multiple-marks-layer/)
Sunburst 차트 How to
1. 위도 및 경도 필드를 각각 행과 열 선반으로 가져옵니다.
2. 계산된 필드 만들기를 활용하여, ‘기준 포인트’라는 이름의 필드를 생성합니다. 아래와 같이 MAKEPOINT 함수를 활용하면, 위도와 경도가 모두 0인 곳에 기준점이 찍히게 됩니다.
3. ‘기준 포인트’ 필드를 마크 > 세부 정보에 드래그를 합니다. 이후, ‘기준 포인트’ 필드를 그래그하여 맵 쪽으로 가져오고, 마크 계층 추가로 드래그 앤 드롭을 합니다.
- 3번에서 진행한 작업을 한번 더 반복하여, 총 3개의 마크를 만들어 줍니다.
- 첫 번째 기준 포인트 마크에서, 마크 모양을 맵에서 파이 차트로 변경해줍니다. 이후, 마크 > 세부정보 아래 공간을 더블클릭하여, min(1) 이라는 수식을 만들고 엔터를 누릅니다. min(1) 필드를 임의로 만들어주는 이유는, 파이 차트의 크기를 조절하기 위함입니다. min(1) 필드를 마크 > 크기 위에 올려준 이후, 파이 차트의 크기를 적당히 키워 줍니다.
6. ‘Continent’ 필드를 그래그 하여, 마크 > 세부정보 / 색상 / 레이블에 올려줍니다. 아울러, Total Medal 필드를 각도에 올려줍니다. 여기까지 따라오셨다면 아래 이미지와 같은 모습을 확인할 수 있습니다.
- 마크에서 기준 포인트 (2)를 클릭한 후, 동일하게 min(1) 필드를 만들어 마크 > 크기 위에 올려줍니다.
- Continent 필드를 마크 > 색상 위에 올리고, Team/NOC(복사본) 필드를 마크 > 세부정보에 올려줍니다. Team/NOC(복사본) 필드는, 임의로 United State of America → USA / People’s Republic of China → China 등의 이름을 변경한 필드입니다.
- 마지막으로 마크에서 기준 포인트 (3)을 클릭한 후, 동일하게 min(1) 필드를 만들어 마크 >크기 위에 올려주고, 크기를 적절히 조절합니다.
- Total Medal 필드를 마크 > 레이블로 끌고 오고, 레이블에 Total Medal 텍스트를 추가합니다.
- 아래 이미지와 같이, 맵 메뉴에서 배경 맵 > 없음을 선택합니다.
- 이후 서식 메뉴를 통해 워크시트 내 테두리를 모두 제거해줍니다. 다만, 파이 차트 색상에서의 테두리 선은 흰색 또는 회색 계열로 변경해줍니다.
- 각 대륙별/국가별 색상을 대시보드 색상인 Blue 계열로 맞춰주고, Total Medal 순으로 정렬 또한 맞춰줍니다. 대륙별/국가별 획득한 메달 갯수 정보를 도구 설명에 넣어주어, 마우스 오버를 통해 해당 정보를 확인할 수 있도록 합니다.
스포츠 데이터 분석의 미래
이번 포스팅에서는 2020 도쿄올림픽 참가국 / 참여 선수 / 획득한 메달 갯수 등 Public에 공개된 데이터를 기반으로 시각화 및 분석을 진행하게 되었습니다.
Public에 공개되지 않은 것으로 보입니다만, 이번 2020 도쿄올림픽에서 화제가 되었던 내용 중 하나인 양궁 선수들의 심박수 데이터를 구할 수 있다면, 굉장히 흥미롭고 의미있는 데이터 시각화 및 분석도 가능하다는 생각이 들었습니다.
(*2020 도쿄 올림픽에서 양궁 선수들의 심박수가 중계화면에 처음으로 노출되었습니다. 세계양궁연맹(WA) 회장님께서 ‘선수들의 생생한 긴장감을 전해주고 싶다’며 심박수 중계에 찬성하여, 선수 포지션에서 약 12m 떨어진 거리에 카메라를 4대 설치하였습니다. 이를 통해 선수들 얼굴의 미세한 색상 변화를 감지하여 맥파 검출 및 심박수 측정이 이뤄졌고, 각 상황마다 선수들의 심박수가 중계화면 왼쪽 하단에 노출되었던 것입니다.)
위 사례에서 볼 수 있듯이, 스포츠 데이터의 종류가 점차 다양해지고 세분화되는 추세입니다. ‘기록의 스포츠’라는 말이 있듯이, 스포츠에서는 다양한 기록들이 발생하고, 이에 따라 데이터 축적 또한 지속적으로 이루어질 것입니다.
이 포스팅을 끝까지 읽으셨다면, 방대한 스포츠 데이터 속에서 숨은 인사이트를 발견하고, 이를 다양한 방식으로 시각화 하는 경험을 해보시기를 적극 권유드립니다. 저 또한 기존에 이뤄지지 않았던 신선한 방식으로 스포츠 데이터를 분석하여 추후 여러분들께 찾아뵙도록 하겠습니다!