들어가기 앞서..
앞으로 4회에 걸쳐 설문데이터를 Tableau를 통하여 분석하는 방법에 대해 다뤄보려 합니다. 많은 분들이 공공 데이터나 재무데이터는 다루신 경험도 많고 유저들이 많이 정보를 올려서 히스토리도 많지만, 설문데이터는 그에 비하여 많은 분들이 쉽게 회사생활에서 접하는 데이터임에도 불구하고 태블로를 통해 분석한 케이스가 많이 없다보니 어려워하시는 경향이 있습니다. 그래서 설문데이터를 분석하는 법에 대해 공유드릴까합니다. 설문 분석 대시보드 보기는 여기를 눌러서 참고해주세요. 포스팅에 쓰인 대시보드를 다운로드 할 수 있습니다. 🙂
주제는 토토로 마을 환경오염 설문조사이며 이번 포스트에서는 도넛차트와 테이블 차트를 중점으로 설명 드리겠습니다. 참고로 데이터는 제가 임의로 만든 가짜 데이터 입니다.
도넛차트는 일반파이 차트보다 차트를 이쁘게 표현할 수 있는 장점이 있습니다. 또한, 도넛차트안에 많은 분석가분들이 집계정보를 작성하여 일반 파이차트보다 정리된 통계정보를 보여 주고 있는데요. 이러한 장점 때문인지, Tableau Gallery Best viz 대시보드들을 보시면 많은 사용자들이 일반 파이차트 보다는 디자인과 정보력이 우수한 도넛차트를 사용하고 있습니다. 이번 포스팅에서는 도넛차트 뿐만 아니라 테이블차트 정보를 넣어 일반 도넛차트 보다 좀더 명확하게 표현하는 법을 알아보겠습니다.
아래는 도넛 차트를 이용한 참여인원 통계분석 대시보드 예시입니다. 토토로 마을에서 서쪽 농사마을 주민들이 설문에 가장 많이 참여해 주셨으며, 의외로 초등학생이 설문에 많이 참여하였네요! ㅎㅎ 토토로 마을 설문 참여자들은 거주기간이 30년 이상인 주민이 무려 30%가 넘는다는 점도 인상적입니다. 이렇게 4개의 그래프를 넣더라도 각 질문에 맞게 다른형식으로 적합한 그래프를 만들어 대시보드에 넣으면 눈에 더 잘 들어오는 참여인원 통계를 만들 수 있습니다.
그럼 아래 대시보드에서 가장 크게 보이는 도넛차트를 만드는 법을 지금부터 알아보시죠
1. 도넛 차트 만들기
Tableau는 도넛차트를 자동으로 만드는 기능을 구현하고 있지 않습니다. Tableau 상단 오른쪽 표현방식에 보면 기본적인 바차트, 라인차트, 비율차트, 파이차트는 자동만들기 기능을 공유하고 있지만, 도넛 차트는 사용자들이 직접 데이터를 집어넣어 만들어야합니다.
도넛 차트 구성은 원과 파이차트 입니다. 기본적인 파이차트안에 하얀 원을 집어넣어 이중축으로 두차트를 겹치는 겁니다.글로는 만드는 계념을 이해하기 어려우니 함께 하나하나 보시면서 이해해 보겠습니다!
1.1 파이차트 만들기
먼저 dummy 데이터를 만들어 주세요. 계산된 필드 만들기를 클릭하시고 필드 이름은 dummy 그리고 값을 0을 넣어주세요. (기존 파이차트와 다르게 dummy를 만드는 이유는 도넛차트는 2개의 그래프를 이중축으로 겹치기 때문에 열에 dummy를 넣어 두개의 그래프를 만들기 위함입니다.)
그리고 다음 순서대로 만들어주세요
- dummy는 열
- 비율을 표기하고 싶은 변수는 색상
- 합계 레코드 수는 크기
- 합계 레코드 수는 각도
- 마지막으로 마크를 파이차트
순서대로 만드셨다면 위와 같은 파이차트가 완성됩니다. 만든 파이차트 안에 하얀 원을 방금 만든 dummy 데이터를 이용하여 만들어 보겠습니다.
자 이제는 dummy를 한번더 열에다가 추가하시고, 두번째 열의 dummy는 원 그래프로 바꾸신 후 원 그래프의 색상, 각도, 크기 필드를 모두 제거해주세요. 다음 원의 크기를 조금 작게 설정한 후 원의 색상을 하얀색으로 바꾸어 줍니다. 이후 이중 축으로 겹친 후 두 그래프의 크기를 다시한번 설정해 주시면 깔끔한 도넛 차트가 완성됩니다.
2. 테이블 만들기
이번에는 테이블 만들기 차례입니다. TMI로 제가 굳이 테이블을 만들어서 도넛차트에 집어넣는 이유가 있습니다.
- 첫번째는 통계학적으로 파이차트 형식의 데이터는 각도를 기반으로 비율을 보여주기 때문에 통계 왜곡이 매우 심한 그래프 입니다. 테이블을 집어넣으면 그러한 단점을 어느정도 보완해줄 수 있습니다.
- 두번째로 파이차트 위에 수치를 표현하게 되면 한눈에 데이터를 쉽게 읽기가 어렵습니다. 그러나 이때 테이블을 넣으면 각 카테고리별로 데이터를 쉽게 비교하고 빠르게 데이터를 습득할 수 있습니다.
- 세번째로는 디자인적으로 더 이뻐요
2.1. 구성비율, 카운트 정보 테이블
그럼 본격적으로 테이블을 만들어 봅시다.
위의 도넛차트와 같은 필드를 행에 넣고 표현방식을 텍스트 테이블로 바꿔주세요.
다음 측정값 이름을 열에 넣으면 많은 양의 측정값 변수들이 추가가 될거에요.
필요없는 변수를 전부 지우기 전에 레코드 수는 구성비율로 만들어주시고, 한번 더 레코드 수를 드래그해서 측정값에 넣어주세요. 그 후에 필요없는 변수를 측정값 구역에서 지우게 되면 아래와 같이 구성비율과 레코드 수를 테이블로 표현하실 수 있습니다.
색상에 행에 사용된 변수 (귀하가소속된 마을은..) 필드를 넣어주세요. 저는 색상을 설정한 뒤에, 디자인을 위해서 테이블 차트의 서식으로 들어가 모든 행과 열의 줄을 없앴습니다. 또한 행에 대한 레이블 숨기기로 불필요한 테이블 정보를 없앴습니다.
텍스트 크기/색상/폰트는 마크안에 있는 색상과 텍스트로 들어가 선호에 따라 맞춰주세요
레코드수 카운트 서식에 들어가서 일반 카운트는 ‘명’으로 접미사에 넣어주세요
구성 비율 레코드 수는 백분율로 만들어주세요. 저는 소수점을 2로 설정했습니다.
정보를 다시 한번 도넛차트와 맞는지 확인하여 주세요.
그리고 마지막으로 정리를 위한 행 정렬을 꼭 잊지 말고 설정해주세요
3. 두개의 워크시트 겹치기
이제 마지막으로 두개의 워크시트를 겹치는 작업만 남았습니다. 대시보드에서 두개의 워크시트를 부동 이라는 기능을 통해 겹치시면 두개의 워크시트를 겹쳐서 표현이 가능합니다. 이후 저의 포스팅에서도 부동은 중요하게 사용되니 꼭 이 기능을 잘 보셨으면 합니다 🙂
3.1. 부동 사용하기
대시보드 왼쪽 맨아래를 보시면 부동기능이 있습니다. 부동기능을 누르시고 파이차트를 대시보드에 끌어 올리시면 바둑판식과 다르게 자유롭게 크기조절이 가능하면서 원하는 위치에 워크시트를 놓으실수 있는 것을 확인할 수 있습니다.
만들었던 테이블 시트를는 부동 기능을 통해 도넛차트안에 넣으시면 됩니다. 그 후, 테이블을 클릭하신 후 오른쪽 마우스 클릭 -> 서식-> 음영서식에 들어가서 테이블 워크시트에 색상을 없애주세요. 그러면 테이블 뒷 하얀 배경 때문에 위치를 맞추기 힘든 부분을 어느정도 해결하실 수 있습니다
4. 완성까지
위의 설명드린 부동 방식을 이용하여 여러 워크시트를 한 대시보드에 겹쳐 넣으면 완성된 대시보드를 얻을 수 있습니다. 원만들기와 총 합계는 간단한 방식이니 아래 구성내용을 설명없이 스크린샷으로 대체하겠습니다
4.1 Dot 워크시트
꿀팁: 행에 대한 정보의 글자색을 하얀색으로 설정하고 글자크기 행의 크기를 최대한 줄이면 해당 글이 시트에서 안보입니다.
4.2 총 합계(주민 수) 워크시트
4.3 완성 대시보드
지금까지 만든 워크시트를 도넛차트 -> 구성비율/카운트 정보 테이블 -> 총합계 워크시트 -> Dot 워크시트 순서대로 대시보드 안에서 겹치시면 아래와 같은 모양이 완성됩니다.
마지막으로 디자인을 위한 사진을 도넛차트안에 넣고 질문 제목을 텍스트 기능을 통해 그래프 상단에 넣으면 아래와 같은 모양의 그래프를 완성하실 수 있습니다.
다음에는 방사형 차트를 통해 질문 유형별로 통계분석하는 방법에 대해 알아보겠습니다. 그럼 모두 각자 필드에서 GA(Good Analytics) 하세요!