STARTERS 4기 🚉/TIL 👶🏻

[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #11 - 과제 발표 및 보완 (230327)

춘시기좋아 2023. 3. 27. 20:42

 

📖 오늘 내가 배운 것

 

1. 과제 발표 및 피드백

2. 대시보드 보완 연구

3. Cheat Sheet

4. 태블로 자격증 문제 풀이

 


1. 과제 발표 및 피드백

1.1 과제 발표

📌 발표 내용

더보기

 

전체 매출 & 각 지역의 기여율
안녕하세요 저희 조는 매출 지표 파악 대시보드를 발표하게 된 4조입니다.우선 저희 조는 두 가지 대시보드를 하나는 전반적인 매출 현황파악,
하나는 지역적으로 세부적으로 매출을 파악할 수 있는 대시보드를 구상하였고, 발표는 지역 세부 대시보드로 하겠습니다.우선 저희 조는 지역 대시보드의 특성 답게 지도가 가장 큰 부분을 차지하고 있는데요.이 지도는 지표를 나타내는 역할과 동작의 역할 두 가지를 하고 있습니다.우선 지표를 나타내는 역할에는state별로 매출이 얼마나 되며, 그 지역의 매출이 전체 매출의 몇 %를 차지하는지를 보여주였습니다.또한 이 state안에 수많은 city들이 있기 때문에 이 state에서 가장 높은 매출을 기여하고 있는 city와 그 매출, 가장 저조한 매출을 기여하고 있는 City와 그 매출을 도구 설명으로 나타내었습니다.그리고 이 지도를 누르면 해당 state의 상세 값을 알 수 있도록 아래 두 가지 차트가 그 state에 맞게 변경됩니다.
 

 

Cohort

좌측 하단 바 차트는 선택된 지역과 카테고리의 총 매출에 대해 각 연도 별로 첫 구매한 고객을 그룹화하여 매출에서 차지하는 비율을 나타냈습니다.
사용한 기법은 FIXED, 집합이며, FIXED와 MIN(Order Date)로 customer 별 첫 구매 연도를 구하여 집합을 걸어 색상으로 표현하고자 하였습니다. 색상을 따로 기입하지 못하여 설명 드리면, 19년도 첫 구매 고객은 진한 파랑색, 20년도 첫 구매 고객은 하늘색, 21년도는 회색, 22년도는 분홍 색으로 표현하였습니다.
차트를 통해 확보할 수 있는 인사이트는 카테고리/지역 별로 신규 고객의 유입량 입니다.


유입을 늘리기 위한 전략을,
유입량이 적절하다면 유지하기 위한 전략을
선택하여 적절한 조치를 취할 수 있습니다.

 

+- 그래프

다음으로 카테고리 별 매출을 직관적으로 비교할 수 있도록 EXCLUDE를 사용했습니다.
지도를 통해 원하는 지역을 선택하고 매개변수를 사용해 원하는 카테고리의 상품을 선택하면, 해당 지역에서 선택한 카테고리에 대한 다른 카테고리와의 차이를 직관적으로 확인할 수 있습니다. (편집됨) 

 

1.2 피드백

📌 우리 피드백

1. 실무에 가까운 대시보드와 디자인

2. 우측 하다 그래프의 시선 처리 어려움, 큰 의미가 없어 보인다.

📌 다른 조 피드백

1. 환불률 차트 세일즈 트래킹에서 중요~ 잘썼다.

2. 리스트 뿌려놓는 거 좋은데 가시성 고려하기

📌 전체 피드백

1. 타겟에 따라 대시보드 난이도 조절이 필요하다! - 퍼블리싱 등 많은 사람들이 보는 대시보드를 만든다면 미팅 제안이 많이 오기 때문 (2년이 지나도 온다고 한다) 

2. 대시보드 cheat sheet 만들면 좋다 (계산식-함수 등 설명 필요한 부분 넣기)

3. 가설을 먼저 만들지 말고 차트로 객관적 사실을 말해주면 된다. 가설을 먼저 만들 경우 끼워 맞춰버리기 쉽기 때문이다.

혹시 데이터에 아웃라이어 있다면? 해당 부분 분석 시작! 데이터 보고 가설 세우기

 

2. 대시보드 보완 연구

2.1 나비 차트 (선택 카테고리별 다른 카테고리)

기존 차트의 서브 카테고리가 잘 보이지 않는다는 피드백을 받아서 나비차트로 다시 표현!

열에 0 추가 → 합계(0) 마크 텍스트에 Sub-category 넣기 → 마크유형: 텍스트 → 영(0) 기준선: 없음

 

1. 축에 0 뜨는 거 제거하려면? : 축 편집 - 눈금선 - 주 눈금선, 보조 눈금선 둘 다 없음으로 표시

2. 가운데 바 없애기 : 마크 유형을 텍스트로

 

2.2 코호트 차트 ([첫 구매 연도에 따른 고객 그룹]이 각 연도 매출에서 차지하는 비중)

기존에 만든 코호트 차트에서 이상한 오류가 있어서 확인해보았다.

오류는 아래와 같이 2022년에 파란색 차트로 29.37%라고 적혀 있는 부분이다.

왜냐하면 저 파란색은 2019년에 첫 구매한 고객을 나타내는 것이기 때문이다.

그래서 왜 2019년에는 값이 없는데 2022년에 2019년 고객이 구매했다고 나올까? 하다가

기존 식의 오류를 발견했다.

좌 : 수정 전 / 우 : 수정 후

 

우선 코호트 차트를 구성하기 위한 과정을 처음 부터 살펴보자!

 

1. 최초로 고객 별 첫 구매 연도를 구하기 위해 작성한 계산식은 다음과 같다.

{FIXED [CUSTOMER NAME] : MIN([ORDER DATE])}

 

2. 전체 Sales, 그리고 서브 카테고리가 선택되었을 때의 매출과 전체 매출에 해당하는 비율 구해준다.

 

위와 같이 각 서브 카테고리를 매개변수로 만들고 사용자가 선택할 수 있게 해두었고,

계산된 필드로 전체/선택한 서브 카테고리에 해당하는 Sales 비율 수치를 뽑아올 수 있게 작성했다.

 

3. 최종적으로 각 연도를 열에, 위에서 만든 비율 수식을 테이블 계산-비율-셀로 작성!

사용자 별 최초 구매 연도를 색상으로 표현한다.

 

여기서 발생할 수 있는 문제점!?

계산의 우선 순위가 FIXED LOD] > [테이블 계산] 이기 때문에

아무리 매개변수 - 테이블 계산을 통해 각 sub-category에 해당하는 데이터를 뽑아와도

표현되는 색상은 customer_id에 fixed로 고정되어 있기 때문에 sub-category가 고려되지 않는다는 점이다.

그래서 이 부분을 고치기 위해 sub-category를 fixed에 추가해주었다.

📌 customer_id의 첫 구매 연도가 sub-category 별이 아니라, 전체 값에 대한 첫 구매 연도로 고정되는 문제 해결

{FIXED [Sub-Category], [CUSTOMER NAME] : MIN([ORDER DATE])}

 

최종 대시보드에서 지도에서 선택한 지역을 동작걸어줄 건데, 해당 부분은 context filter로 fixed lod보다 높은 우선순위를 주어 먼저 지역이 걸러지고, 해당 지역 안에서 첫 구매 연도를 계산하게 하면 된다.

 

 

📌 작업 순서

1. FIXED [Sub-Category], [CUSTOMER NAME] 고정 후 첫 주문 연도 가져오기 - 색상 표현
2. 동작 -> 컨택스트 필터로 지역! 그럼 해당 지역의 데이터만 걸러지고
3. 계산된 필드에서 서브 카테고리 별 고객 별 최소 주문 연도를 뽑을 수 있다.

4. 테이블 계산은 구성비율-cell로~

 

 

2.3 MAP - State 별 최소/최대 City 표현하기

각 도시의 측정값을 최소/최대로 변경한 후 해당 시트를 지도의 도구 설명에 입력하였다.

우리가 원하는대로 알맞은 최소/최대 city와 sales의 평균이 잘 표시되었다.

 

3. Cheat Sheet

우리의 대시보드를 이해할 수 있도록 cheatsheet도 제작하였다!!!


💪🏻 좋았던 점, 앞으로 개선해야 할 점 (추가로 배워야 할 점)

 

📌 배운 내용을 떠올리고 활용하는 능력 부족

📌 다양한 데이터를 통해 대시보드를 구성하는 훈련 필요

 

#유데미, #유데미코리아, #유데미부트캠프, #취업부트캠프, #부트캠프후기, #스타터스부트캠프, #데이터시각화 #데이터분석 #태블로