관리 메뉴

ilovechoonsik

[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #3 (230315) 본문

STARTERS 4기 🚉/TIL 👶🏻

[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #3 (230315)

춘시기좋아 2023. 3. 15. 23:38

 

📖 오늘 내가 배운 것

 

1. 과제 피드백

2. 간단 시각화 방안

3. 금일 과제

 

1. 과제 피드백

1.1 전체적인 과제 피드백

  • 전 달보다 크게 수익이 늘어난 호스트
  • 오래되었지만 수익이 안 나거나 리뷰가 떨어진 호스트 집중 관리
  • 첫 두 달은 리뷰에서 제외하기 

  • 리뷰 비율 살펴보기
  • 매출 10% 미만 중 리뷰가 있는 Data
  • 가장 최근을 기준으로 잘하고 있는 호스트가 가장 중요하다. 

  • score 만들기: 100점 만점으로
  • 어디 있는지 직관적으로 볼 수 있는 것이 좋다. 
  • 이중축 사용시 하단에 텍스트로 부가설명이 필요하다.

 

1.2 우리 조 피드백

  • 매크로 의심 boxplot 수정: room 수가 많다고 매크로 X, 방은 많지만 리뷰가 없거나 리뷰가 있어도 최악인 방을 추가해 주기
  • 고객에게 보여주기 무리인 대시보드이다. 너무 데이터 별로 퍼져있다.
    캡처하고 PPT로 설명하는 마지막 보고서에 넣어야 한다. (대시보드 보다는)
  • 클라이언트가 쓸 수 있게 출판용 & 설명용 대시보드 분리하기
  • 애매한 것은 하단에 텍스트로 설명하기

 

2. 간단 시각화 방안

2.1 이중축 활용

막대에서 이중축 사용하면 보기가 혼란스러움

 

1. 원하는 차원 하나 고르기

2. 측정값 두 개 고르기

3. 이중축 선택

4. 전체를 막대로 변화시켜 주기

5. 이중축 동기화

6. 비율 만들어주기: 맨 위에 만들어주면 좋기 때문에 sales에 놓기 

 

 

2.2 도넛 차트

→ 반 도넛 차트 만들지 말기!

 

1. 행에 0 두 번 입력

 

 

 

2. 전체를 파이차트로 변경해 주기

3. 원 하나 연한 색으로 주기 (흰색 or 회색)

4. 두 번째 원의 크기 줄여주기 

5. 이중축으로 만들어주기

6. 1번에 각도 넣어주기 

7. Region: 색상 / Sales: 각도 / 레이블: Sales

8. 선 없애는 법: 머리글 표시 해제 

9. 그래프 우클릭 > 서식 > 테두리 모두 없음으로 변경 

 

 

2.3 롤리팝 차트

📌 롤리팝?

: 막대가 진짜고 숫자가 눈에 잘 띄게 하기 위해 원을 추가한 것이다.

 

📌 사용?

: 요소가 많을 때 많이 사용한다.

 

📌 주의사항

1. 숫자 깨질 경우 전체에 레이블 넣기

2. 지금 내가 어느 마크에 적용하고 있는지 잘 확인하기!

 

1. 기본 세팅 

2. 이중축 적용 

3. 원에 숫자 넣어주기: 위치 지정 

 

2.4 나비 차트

주로 사용하면 좋은 데이터 : 남녀성비 / 연령대 등 (- 가 있으면 좋지 않다. )

무슨 차원을 기준으로 볼 것인지 정해주어야 한다.

 

  • 좌측 그래프: 우클릭 > 축편집 > 반전
  • 우클릭 > 축편집 > 일반 > 범위 > 고정 > 고정된 끝: 60000

 

2.5 변화율 화살표 만들기

사용기호: ▲ ▼

 

1. 집계함수, 0 잘 포함해서 계산된 필드 만들기 (0 꼭 포함)

2. 서식 지정

 

2.6 변화율 

(1) 퀵테이블

태블로에서 빠르게 테이블 단위 계산을 수행해 주는 도구!

행 별 비율 차이도 구할 수 있어 활용도가 높은데~ 단점은?

 

- 기준이 되는 첫 열의 값이 사라진다는 점

- 한 값을 특정해서 띄우지 못한다는 점

 

(2) Datediff 사용 

시계열 데이터 사용 중 이를 극복하려면 계산식 + Datediff 사용

  • datediff 함수에 day, year 등 사용 가능
  • -1일 때는 today 사용 불가
  • 이번 달 거 보고 싶으면 datediff를 0으로 설정
  • today로 설정하면 자동화가 가능

 

📌 예시를 보자

tmp1 계산 식

sum(if datediff('month',[Order Date],today())=12 THEN [Profit] END)

today() = 23년 3월이고

 

기준이 'month'니까 23년 3월에서 특정 연도의 달을 빼줬을 때, 그 값이 12달

-> 결과는 당연히 22년 3월

 

확인해 보자

23년 3월 - 12개월 = 22년 3월

그리고 해당 기간 Profit 합계

 

3. 금일 과제

3.1 어제 과제 수정하며 주목한 점

1. 연도별 host 수 그래프
강사님이 보셨을 때 딱히 의미가 없는 그래프
좀 더 의미 있는 정보를 찾으면 대체하면 좋을 것 같다.

2. 매크로 의심 boxplot
대시보드에서는 boxplot 잘 쓰이지 X 
차라리 지도로 바꾸는 것이 낫다.
host id / count / rating avg 

3. 로열 고객
텍스트 그래프로 바꾼 다음에 해당 유저를 클릭하면 해당 유저의 정보가 뜰 수 있도록 한다.
집합에 쓰인 수식은 로열 고객을 골라낼 수 있는 용도로만 사용

 

 

3.2 대시보드

목표 : 경쟁력 갖추기 위해 host 맞춤 관리 전략 필요, bad, good host 리스트를 제공하여 편하게 관리할 수 있게 만들어주자

 

1. 지역 별로 Bad Host, Good host가 어느 위치에 분포되어 있는지 확인 가능

2. 해당 지역의 Bad Host, Good host 리스트 확인 가능

3. 클릭 시 해당 hostid의 정보 확인 가능

->  map에 bad, good host 별 분포 확인할 수 있도록 하려 했는데 실패! 각 list를 어떻게 map으로 끌고 와야 할지 감이 안 옴

 

Good Host 선정 기준

(총 리뷰 수 * 평점 평균) / (보유 방 개수) 점수가 높은 호스트들은 운영을 잘하고 있다고 보았다.
그리고 그중에서 평균 Price가 높은 호스트들은 에어비앤비에 더 많은 이익을 가져다줄 수 있는 Good Host라고 보았다.

좋고 나쁨의 기준은 상위 20% 적용

 

Bad Host 선정기준

보유하고 있는 방 개수가 4개 이상 & 평점이 74.5보다 낮은 Host를 Bad Host라고 선정하였다.* 방 개수 기준 : 호스트당 전체 방 보유 개수의 이상치 적용
* 평점 기준 : 전체 방 평점의 이상치 적용


참조

 

[1] 상위 N개 대신 상위 N 비율 필터링

https://kb.tableau.com/articles/howto/displaying-top-percent-instead-of-top-n?lang=ko-kr 

 

상위 N개 대신 상위 N 비율 필터링 | Tableau Software

답변 첨부 섹션의 예제 통합 문서에서는 Superstore 샘플 데이터 집합을 사용하여 다음 지침을 설명합니다. 시나리오 1: 항목 수 기준 상위 N% 이 옵션은 매출에 따라 분류된 고객의 상위 N%를 반환합

kb.tableau.com

1. 비율에 해당하는 매개 변수 생성

2. 계산된 필드에서 PERCENTILE() 사용해서 비율 계산

3. 필터 설정 후 표시 OR  고정 후 사용

 

+ 각 행의 값 0-100 정규화

[각 행 별 계산할 값] / {FIXED: 집계식} * 100

 

FIXED [각 행 별 계산할 값] : 집계식 <- 요롷게 만들면 자기 자신 / 자기 자신 되어 버려서 전부 1 뜸

 


💪🏻 좋았던 점, 앞으로 개선해야 할 점 (추가로 배워야 할 점)

 

📌 열심히 강의 들으며 정리했던 태블로 개념들.. 막상 필요한 순간 기억나지 않아 활용하기 힘들다

어느 정도 구글링으로 커버할 수 있어 다행이었고, 재정리/복습 무조건해야 함

 

 

 

#유데미, #유데미코리아, #유데미부트캠프, #취업부트캠프, #부트캠프후기, #스타터스부트캠프, #데이터시각화 #데이터분석 #태블로

Comments