ilovechoonsik
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #5 (230317) 본문
📖 오늘 내가 배운 것
1. 과제 발표 및 피드백
2. 태블로 테크닉
3. 과제 대시보드 보완 연구
1. 과제 발표 및 피드백
1.1 과제 발표
1. 목표 및 현황
저희 조는 이 프로젝트의 목표를 호스트 맞춤형 관리 전략으로 정했는데요.이 대시보드를 직접 에어비앤비 매니저들이 관리하면서 Bad, good host들의 정보를 쉽게 보면서 관리할 수 있도록 하였습니다.
우선 현재 에어비앤비의 현황을 보시면, 매년 호스트의 등록 수가 증가하고 있는데요. 사실 좋은 호스트만 증가한다면 아주 좋지만 그렇지 않은 호스트들의 증가는 무분별한 서버 비용 낭비로 이어질 수 있습니다. 그래서 이런 호스트들을 Bad host로 선별하여 경고 조치나 서비스의 퀄리티가 좋아질 수 있도록 가이드라인 제시를 해서 서버 비용을 절약할 수 있다고 생각하였습니다.
또한, 박스 플롯 보시면 호스트 당 관리하는 숙소가 많을수록 평점이 1개 숙소를 관리할 때보다 전반적인 분포가 낮아지는 것을 보실 수 있습니다.
저희의 전략은 크게 두 가지로 분류할 수 있습니다.
첫 번째로 숙소 개수가 많고 평점이 낮은 호스트를 Bad Host로 지정하여 이들을 대상으로 운영 확인 절차를 통해 실제 운영하지 않는 숙소를 확인합니다. 이를 통해 서버 비용을 절약하거나 가이드라인을 제시하여 개선을 유도할 수 있습니다.
두 번째로 평점이 높고 리뷰 개수가 많고 가격이 비싼 숙소를 가지고 있는 호스트들을 Good Host로 선정하여 베네핏을 제공함으로써 타 플랫폼으로의 이탈을 방지할 수 있습니다.
2. 대시보드 설명
Good host 선정 시 1차로 (총리뷰수 * 평점평균 / 보유 숙소 개수)에서 상위 20%인 host를 1차로 선별한 뒤 에어비앤비에 수익을 많이 가져다줄 수 있는 평균 Price 상위 20% host를 다시 선별하여 Good host로 간주하였습니다.
Bad host의 기준을 잡을 때 호스트 당 숙소 수의 이상치인 3개보다 숙소를 많이 보유하고 있거나 숙소 당 평균 평점의 이상치인 74.5점 보다 낮은 숙소를 가진 Host를 Bad Host로 간주하였습니다.
3. 대시보드
대시보드우선 저희 조 대시보드는 이렇게 구성되어 있고, 이 대시보드는 에어비앤비에서 호스트를 관리하는 매니저들이 직접 사용하면서 good, bad host의 지역과 상세 정보를 바로 볼 수 있도록 하였습니다. 그래서 매니저는 상단에서 자신이 관리하는 지역 필터를 고르고
거기서 good, bad host를 한 번에 보고 뜬 리스트들에서 하나의 정보를 클릭하면 아래에는 상세 정보가 뜰 수 있도록 하였습니다. 대시보드 아래에는 대시보드만 보고도 good, bad host의 기준이 무엇인지 전반적으로 바로 파악할 수 있도록 부가 설명을 넣었고요.—한 가지 아쉬운 점은 필터를 통해 지역을 선택하면 지역 별로 일정 비율의 Good Host가 출력되도록 컨텍스트 필터를 활용하려고 했는데 저희 대시보드에는 잘 반영되지 않았습니다.
1.2 피드백
📌 잘한 점
1. 지도에 에어비앤비 로고 (가시성 확보)
2. 대시보드 사용 타겟을 명확히 정한 것 (에어비엔비 호스트 관리 업무 수행하시는 분들)
-> 실무에서 쓰기 좋은 대시보드
📌 보완할 점
1. 근거로 사용한 데이터, 그래프에 대한 설명이 명확하지 않음!
→ 특히 박스 플롯은 잘라서 필요한 부분만 보여주거나 했으면 좋았겠다!
2. 지도에 지역명 표현으로 가시성 챙기기
📌 팁
1. 사용하는 데이터 이해 충분해야 함
2. 임원 분들께 중심이 서울이지? 총인구수는? 총매출 얼마고, 이익 얼마야?
이런 바탕이 되는 데이터에 대한 질문이 바로 들어올 수 있다!
-> 핵심 수치 및 결론을 바로 설명 가능할 정도로 암기하기
-> 결론으로 딱 떨어질 수 있으면 좋음!
ex) 저희는 금년 서울 지역 총매출 400억 기록하였고, 순이익 50억 기록하였습니다. 앞으로의 증감은 ~~ 합니다
2. 태블로 테크닉
1.1 ABC 지우기
1.2 그랜드 토탈 - 행 열 별 총계
텍스트 테이블의 경우 전부 총합한 결과를 보고 싶어 하시는 경우가 있다.
[분석] - [총계] - [다양한 옵션] 사용하기
1.3 필드 이름 상단에 배치
[분석] - [테이블 레이아웃] - [고급]
1.4 행 사이에 빈행 배치
1.5 인덱스 부여를 통한 연속형 테이블 -> 불연속형 테이블
태블로는 집합으로 계산하는 성질 있음! 그렇기 때문에 좌측 사진과 같이 상위 차원의 지역으로 묶어 표현!
이걸 풀어서 보고 싶다면
행 인덱스 반환하는 INDEX()를 개별적으로 동작하는 불연속형 차원으로 생성하여
테이블 제일 앞으로~
INDEX() 넣기 이전에 지역 중 가장 상위 차원이었던 Country/Region, 해당 차원 윗단에 불연속형 INDEX() 넣어주면
생성된 행 번호로 아래 차원들이 흩어진다!
근데 문제가 있는데?
INDEX() 쓰면 전부 문자열로 나오기 때문에 문제가 생길 수 있다. 결과값 보는 정도로만 사용하기
📌 연속형, 불연속형
연속형 : 상위 차원에 귀속 > 상위 차원의 하위로 연속됨
불연속형 : 상위 차원 귀속에서 벗어나 독립적으로 동작
쉽게
불연속형 : 표현 방식이 상위 차원 배제된 상태로 하위 차원의 값으로 집계되어 보여지냐,
연속형 : 상위 차원 개입된 상태로 하위 차원 집계되어 이어지는 형식으로 보여지냐의 차이
좌 : 불연속 / 우 : 연속
학습하며 이해한 대로 적어봤는데, 혹시 잘못된 부분 있다면 지적 부탁드립니다👶🏻
1.6 많이 사용하는 DATE 함수?
weekday() : 월화수목금 숫자로 변환시켜 주는 것
날짜 형식 바꾸는 법 : [기본 속성] - [날짜 형식]
DATEPARSE() :
20210321
YYYYMMDD
2021-03-21
YYYY-MM-DD
STRING으로 바꾸는 법 : LEFT(STR(DATE),4)
왜 STR로 바꾸고 LEFT로 자를까? → DATE가 다루기 어렵기 때문에 여러 오류들이 생길 수 있다!
때문에 텍스트 필드로 만들 때는 아예 STR로 변환
3. 과제 대시보드 보완 연구
3.1 기존 문제점
들어가기 전, 우리 팀의 GOOD HOST 선정 기준을 살펴보아야 한다
📌 GOOD HOST 선정 기준은?
1차 : hostid 별 핵심 지표 고려하여 Score 계산, 수식은 다음과 같다
(총 리뷰 수 * 평균 평점) / 보유 숙소 개수
2차 : hostid 별 보유하고 있는 평균 숙소 가격이 상위 20%인 호스트
위 조건을 적용하기 위해 다양한 방법을 시도해보며 발생한 문제점들이 존재하는데...
1차로 20% 필터링 후 Price로 다시 20% 필터링하는 과정에서
지역 필터를 걸어도 전체 값으로 계산된다는 점이었다!
LOD를 사용하는 과정에서 발생한 문제라고 생각되며 차후에 LOD를 배우게 된다면 처음부터 다시 구성해 보도록 하자
3.2 개선 방안
📌 RANK로
LOD를 사용하지 않고 SIZE()를 통해 행 개수를 반환받고, 2/10를 곱해주는 것으로 완전 raw 하게 목표를 달성하였다.
하지만 이 방법은 임시방편이고, 다양한 문제들이 발생할 수 있다고 멘토님께서 말씀하셨다!👻
멘토님 께서도 해결 방안을 찾아보신다고 말씀하셨고, 곧 LOD도 다시 배우니 추후에 재도전해보자💪🏻
참조
[1] RANK 사용법
https://tedparkdev.tistory.com/27
Tableau(태블로) - Rank 함수 사용하여 순위 표시
1. 데이터 보기 옆 아래 화살표 클릭 > 계산된 필드 만들기 2. 함수 입력 3. 만든 함수를 행에 추가 계산된 필드가 연속형으로 되어있어 아래 이미지와 같이 표시된다. 4. 계산된 필드를 불연속형으
tedparkdev.tistory.com
테이블 계산 유형
이 문서에서는 Tableau에서 사용할 수 있는 테이블 계산의 유형과 사용 시기에 대해 설명합니다
help.tableau.com
[2] 태블로 계산된 필드 주요 함수 - SIZE() 참고
https://datalking.tistory.com/18
[인프런] 웰컴 투 태블로 월드 - 3. 태블로의 주요 기능 익히기(계산된 필드)
개요 지난 포스팅에서는 Tableau에서 지도를 활용하여 대한민국 시도 및 시군구 시각화를 수행하는 방법, 행정구역 필드를 계층 구조로 만드는 방법, 마크 카드 밀도 방식으로 시각화했을 때의 특
datalking.tistory.com
https://blog.naver.com/PostView.naver?blogId=camoyun&logNo=222870259648
[태블로] Tableau Functions 정리! (Number, String, Logical,Table calculation)
(거의) 모든 태블로 Function을 정리해봤다. (워낙 태블로 Help 페이지에 자세히 나와있지만, 너어무 많...
blog.naver.com
[3] 우선순위 기준으로 ORDERBY, PARTITION 사용하려 했는데 존재하지 않는 함수라 함
https://help.tableau.com/current/prep/ko-kr/prep_calculations.htm
세부 수준(LOD), 순위 및 분위 계산 만들기
참고: 버전 2020
help.tableau.com
[4] 컨텍스트 필터
https://help.tableau.com/current/pro/desktop/ko-kr/filtering_context.htm
컨텍스트 필터 사용
기본적으로 Tableau에서 설정한 모든 필터는 독립적으로 계산됩니다
help.tableau.com
💪🏻 좋았던 점, 앞으로 개선해야 할 점 (추가로 배워야 할 점)
📌 으악! PT 역량이 매우매우 부족하다....
자신감 있게 말하는 연습을 수시로 해보자 🐯
📌 LOD를 많이 사용할수록 늪에 빠지기 쉽다고 하셨다
꼭 필요한 상황에, 일단 뭔지 확실히 배우고 사용하도록 하자 🐻❄️
#유데미, #유데미코리아, #유데미부트캠프, #취업부트캠프, #부트캠프후기, #스타터스부트캠프, #데이터시각화 #데이터분석 #태블로
'STARTERS 4기 🚉 > TIL 👶🏻' 카테고리의 다른 글
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #7 - 태블로 함수 및 테이블 계산, 날짜 필터링, ATTR (230321) (0) | 2023.03.22 |
---|---|
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #6 - 계산된 필드, Primary 함수 (230320) (0) | 2023.03.20 |
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #4 (230316) (0) | 2023.03.16 |
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #3 (230315) (0) | 2023.03.15 |
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #2 (230314) (0) | 2023.03.15 |