ilovechoonsik
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #3 (230315) 본문

📖 오늘 내가 배운 것
1. 과제 피드백
2. 간단 시각화 방안
3. 금일 과제
1. 과제 피드백
1.1 전체적인 과제 피드백
- 전 달보다 크게 수익이 늘어난 호스트
- 오래되었지만 수익이 안 나거나 리뷰가 떨어진 호스트 집중 관리
- 첫 두 달은 리뷰에서 제외하기
- 리뷰 비율 살펴보기
- 매출 10% 미만 중 리뷰가 있는 Data
- 가장 최근을 기준으로 잘하고 있는 호스트가 가장 중요하다.
- score 만들기: 100점 만점으로
- 어디 있는지 직관적으로 볼 수 있는 것이 좋다.
- 이중축 사용시 하단에 텍스트로 부가설명이 필요하다.
1.2 우리 조 피드백
- 매크로 의심 boxplot 수정: room 수가 많다고 매크로 X, 방은 많지만 리뷰가 없거나 리뷰가 있어도 최악인 방을 추가해 주기
- 고객에게 보여주기 무리인 대시보드이다. 너무 데이터 별로 퍼져있다.
캡처하고 PPT로 설명하는 마지막 보고서에 넣어야 한다. (대시보드 보다는) - 클라이언트가 쓸 수 있게 출판용 & 설명용 대시보드 분리하기
- 애매한 것은 하단에 텍스트로 설명하기
2. 간단 시각화 방안
2.1 이중축 활용
막대에서 이중축 사용하면 보기가 혼란스러움
1. 원하는 차원 하나 고르기
2. 측정값 두 개 고르기
3. 이중축 선택
4. 전체를 막대로 변화시켜 주기
5. 이중축 동기화
6. 비율 만들어주기: 맨 위에 만들어주면 좋기 때문에 sales에 놓기
2.2 도넛 차트
→ 반 도넛 차트 만들지 말기!
1. 행에 0 두 번 입력
2. 전체를 파이차트로 변경해 주기
3. 원 하나 연한 색으로 주기 (흰색 or 회색)
4. 두 번째 원의 크기 줄여주기
5. 이중축으로 만들어주기
6. 1번에 각도 넣어주기
7. Region: 색상 / Sales: 각도 / 레이블: Sales
8. 선 없애는 법: 머리글 표시 해제
9. 그래프 우클릭 > 서식 > 테두리 모두 없음으로 변경
2.3 롤리팝 차트
📌 롤리팝?
: 막대가 진짜고 숫자가 눈에 잘 띄게 하기 위해 원을 추가한 것이다.
📌 사용?
: 요소가 많을 때 많이 사용한다.
📌 주의사항
1. 숫자 깨질 경우 전체에 레이블 넣기
2. 지금 내가 어느 마크에 적용하고 있는지 잘 확인하기!
1. 기본 세팅
2. 이중축 적용
3. 원에 숫자 넣어주기: 위치 지정
2.4 나비 차트
주로 사용하면 좋은 데이터 : 남녀성비 / 연령대 등 (- 가 있으면 좋지 않다. )
무슨 차원을 기준으로 볼 것인지 정해주어야 한다.
- 좌측 그래프: 우클릭 > 축편집 > 반전
- 우클릭 > 축편집 > 일반 > 범위 > 고정 > 고정된 끝: 60000
2.5 변화율 화살표 만들기
사용기호: ▲ ▼
1. 집계함수, 0 잘 포함해서 계산된 필드 만들기 (0 꼭 포함)
2. 서식 지정
2.6 변화율
(1) 퀵테이블
태블로에서 빠르게 테이블 단위 계산을 수행해 주는 도구!
행 별 비율 차이도 구할 수 있어 활용도가 높은데~ 단점은?
- 기준이 되는 첫 열의 값이 사라진다는 점
- 한 값을 특정해서 띄우지 못한다는 점
(2) Datediff 사용
시계열 데이터 사용 중 이를 극복하려면 계산식 + Datediff 사용
- datediff 함수에 day, year 등 사용 가능
- -1일 때는 today 사용 불가
- 이번 달 거 보고 싶으면 datediff를 0으로 설정
- today로 설정하면 자동화가 가능
📌 예시를 보자
tmp1 계산 식
sum(if datediff('month',[Order Date],today())=12 THEN [Profit] END)
today() = 23년 3월이고
기준이 'month'니까 23년 3월에서 특정 연도의 달을 빼줬을 때, 그 값이 12달
-> 결과는 당연히 22년 3월
확인해 보자
23년 3월 - 12개월 = 22년 3월
그리고 해당 기간 Profit 합계
3. 금일 과제
3.1 어제 과제 수정하며 주목한 점
1. 연도별 host 수 그래프
강사님이 보셨을 때 딱히 의미가 없는 그래프
좀 더 의미 있는 정보를 찾으면 대체하면 좋을 것 같다.
2. 매크로 의심 boxplot
대시보드에서는 boxplot 잘 쓰이지 X
차라리 지도로 바꾸는 것이 낫다.
host id / count / rating avg
3. 로열 고객
텍스트 그래프로 바꾼 다음에 해당 유저를 클릭하면 해당 유저의 정보가 뜰 수 있도록 한다.
집합에 쓰인 수식은 로열 고객을 골라낼 수 있는 용도로만 사용
3.2 대시보드
목표 : 경쟁력 갖추기 위해 host 맞춤 관리 전략 필요, bad, good host 리스트를 제공하여 편하게 관리할 수 있게 만들어주자
1. 지역 별로 Bad Host, Good host가 어느 위치에 분포되어 있는지 확인 가능
2. 해당 지역의 Bad Host, Good host 리스트 확인 가능
3. 클릭 시 해당 hostid의 정보 확인 가능
-> map에 bad, good host 별 분포 확인할 수 있도록 하려 했는데 실패! 각 list를 어떻게 map으로 끌고 와야 할지 감이 안 옴
Good Host 선정 기준
(총 리뷰 수 * 평점 평균) / (보유 방 개수) 점수가 높은 호스트들은 운영을 잘하고 있다고 보았다.
그리고 그중에서 평균 Price가 높은 호스트들은 에어비앤비에 더 많은 이익을 가져다줄 수 있는 Good Host라고 보았다.
좋고 나쁨의 기준은 상위 20% 적용
Bad Host 선정기준
보유하고 있는 방 개수가 4개 이상 & 평점이 74.5보다 낮은 Host를 Bad Host라고 선정하였다.* 방 개수 기준 : 호스트당 전체 방 보유 개수의 이상치 적용
* 평점 기준 : 전체 방 평점의 이상치 적용
참조
[1] 상위 N개 대신 상위 N 비율 필터링
https://kb.tableau.com/articles/howto/displaying-top-percent-instead-of-top-n?lang=ko-kr
상위 N개 대신 상위 N 비율 필터링 | Tableau Software
답변 첨부 섹션의 예제 통합 문서에서는 Superstore 샘플 데이터 집합을 사용하여 다음 지침을 설명합니다. 시나리오 1: 항목 수 기준 상위 N% 이 옵션은 매출에 따라 분류된 고객의 상위 N%를 반환합
kb.tableau.com
1. 비율에 해당하는 매개 변수 생성
2. 계산된 필드에서 PERCENTILE() 사용해서 비율 계산
3. 필터 설정 후 표시 OR 고정 후 사용
+ 각 행의 값 0-100 정규화
[각 행 별 계산할 값] / {FIXED: 집계식} * 100
FIXED [각 행 별 계산할 값] : 집계식 <- 요롷게 만들면 자기 자신 / 자기 자신 되어 버려서 전부 1 뜸
💪🏻 좋았던 점, 앞으로 개선해야 할 점 (추가로 배워야 할 점)
📌 열심히 강의 들으며 정리했던 태블로 개념들.. 막상 필요한 순간 기억나지 않아 활용하기 힘들다
어느 정도 구글링으로 커버할 수 있어 다행이었고, 재정리/복습 무조건해야 함
#유데미, #유데미코리아, #유데미부트캠프, #취업부트캠프, #부트캠프후기, #스타터스부트캠프, #데이터시각화 #데이터분석 #태블로
'STARTERS 4기 🚉 > TIL 👶🏻' 카테고리의 다른 글
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #5 (230317) (0) | 2023.03.20 |
---|---|
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #4 (230316) (0) | 2023.03.16 |
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #2 (230314) (0) | 2023.03.15 |
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #1 (230313) (0) | 2023.03.13 |
[STARTERS 4기 TIL] 중간 평가 대비 Python, SQL 복습 (230309,10) (0) | 2023.03.10 |