관리 메뉴

ilovechoonsik

[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #5 (230317) 본문

STARTERS 4기 🚉/TIL 👶🏻

[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #5 (230317)

춘시기좋아 2023. 3. 20. 00:59

 

📖 오늘 내가 배운 것

 

1. 과제 발표 및 피드백

2. 태블로 테크닉

3. 과제 대시보드 보완 연구

 


1. 과제 발표 및 피드백

1.1 과제 발표

더보기

1. 목표 및 현황

 저희 조는 이 프로젝트의 목표를 호스트 맞춤형 관리 전략으로 정했는데요.이 대시보드를 직접 에어비앤비 매니저들이 관리하면서 Bad, good host들의 정보를 쉽게 보면서 관리할 수 있도록 하였습니다.

 우선 현재 에어비앤비의 현황을 보시면, 매년 호스트의 등록 수가 증가하고 있는데요. 사실 좋은 호스트만 증가한다면 아주 좋지만 그렇지 않은 호스트들의 증가는 무분별한 서버 비용 낭비로 이어질 수 있습니다. 그래서 이런 호스트들을 Bad host로 선별하여 경고 조치나 서비스의 퀄리티가 좋아질 수 있도록 가이드라인 제시를 해서 서버 비용을 절약할 수 있다고 생각하였습니다.

 또한, 박스 플롯 보시면 호스트 당 관리하는 숙소가 많을수록 평점이 1개 숙소를 관리할 때보다 전반적인 분포가 낮아지는 것을 보실 수 있습니다.

 

 저희의 전략은 크게 두 가지로 분류할 수 있습니다.
 첫 번째로 숙소 개수가 많고 평점이 낮은 호스트를 Bad Host로 지정하여 이들을 대상으로 운영 확인 절차를 통해 실제 운영하지 않는 숙소를 확인합니다. 이를 통해 서버 비용을 절약하거나 가이드라인을 제시하여 개선을 유도할 수 있습니다.
 두 번째로 평점이 높고 리뷰 개수가 많고 가격이 비싼 숙소를 가지고 있는 호스트들을 Good Host로 선정하여 베네핏을 제공함으로써 타 플랫폼으로의 이탈을 방지할 수 있습니다.

 

2. 대시보드 설명

 Good host 선정 시 1차로  (총리뷰수 * 평점평균 / 보유 숙소 개수)에서 상위 20%인 host를 1차로 선별한 뒤 에어비앤비에 수익을 많이 가져다줄 수 있는 평균 Price 상위 20% host를 다시 선별하여 Good host로 간주하였습니다.


 Bad host의 기준을 잡을 때 호스트 당 숙소 수의 이상치인 3개보다 숙소를 많이 보유하고 있거나 숙소 당 평균 평점의 이상치인 74.5점 보다 낮은 숙소를 가진 Host를 Bad Host로 간주하였습니다.

 

 

3. 대시보드 

 대시보드우선 저희 조 대시보드는 이렇게 구성되어 있고, 이 대시보드는 에어비앤비에서 호스트를 관리하는 매니저들이 직접 사용하면서 good, bad host의 지역과 상세 정보를 바로 볼 수 있도록 하였습니다. 그래서 매니저는 상단에서 자신이 관리하는 지역 필터를 고르고
 거기서 good, bad host를 한 번에 보고 뜬 리스트들에서 하나의 정보를 클릭하면 아래에는 상세 정보가 뜰 수 있도록 하였습니다. 대시보드 아래에는 대시보드만 보고도 good, bad host의 기준이 무엇인지 전반적으로 바로 파악할 수 있도록 부가 설명을 넣었고요.한 가지 아쉬운 점은 필터를 통해 지역을 선택하면 지역 별로 일정 비율의 Good Host가 출력되도록 컨텍스트 필터를 활용하려고 했는데 저희 대시보드에는 잘 반영되지 않았습니다.

 

1.2 피드백

📌 잘한 점

1. 지도에 에어비앤비 로고 (가시성 확보)

2. 대시보드 사용 타겟을 명확히 정한 것 (에어비엔비 호스트 관리 업무 수행하시는 분들)

-> 실무에서 쓰기 좋은 대시보드

 

📌 보완할 점

1. 근거로 사용한 데이터, 그래프에 대한 설명이 명확하지 않음!

→ 특히 박스 플롯은 잘라서 필요한 부분만 보여주거나 했으면 좋았겠다!

2. 지도에 지역명 표현으로 가시성 챙기기

 

📌 

1. 사용하는 데이터 이해 충분해야 함

2. 임원 분들께 중심이 서울이지? 총인구수는? 총매출 얼마고, 이익 얼마야?

이런 바탕이 되는 데이터에 대한 질문이 바로 들어올 수 있다!

-> 핵심 수치 및 결론을 바로 설명 가능할 정도로 암기하기

-> 결론으로 딱 떨어질 수 있으면 좋음!

ex) 저희는 금년 서울 지역 총매출 400억 기록하였고, 순이익 50억 기록하였습니다. 앞으로의 증감은 ~~ 합니다

 

2. 태블로 테크닉

1.1 ABC 지우기

 

1.2 그랜드 토탈 - 행 열 별 총계

텍스트 테이블의 경우 전부 총합한 결과를 보고 싶어 하시는 경우가 있다.

 

[분석] - [총계] - [다양한 옵션] 사용하기

 

 

1.3 필드 이름 상단에 배치

[분석] - [테이블 레이아웃] - [고급]

 

1.4 행 사이에 빈행 배치

 

 

1.5 인덱스 부여를 통한 연속형 테이블 -> 불연속형 테이블

태블로는 집합으로 계산하는 성질 있음! 그렇기 때문에 좌측 사진과 같이 상위 차원의 지역으로 묶어 표현! 

이걸 풀어서 보고 싶다면

행 인덱스 반환하는 INDEX()를 개별적으로 동작하는 불연속형 차원으로 생성하여

테이블 제일 앞으로~

 

INDEX() 넣기 이전에 지역 중 가장 상위 차원이었던 Country/Region, 해당 차원 윗단에 불연속형 INDEX() 넣어주면

생성된 행 번호로 아래 차원들이 흩어진다!

 

근데 문제가 있는데?

INDEX() 쓰면 전부 문자열로 나오기 때문에 문제가 생길 수 있다. 결과값 보는 정도로만 사용하기

 

📌 연속형, 불연속형

연속형 : 상위 차원에 귀속 > 상위 차원의 하위로 연속됨

불연속형 : 상위 차원 귀속에서 벗어나 독립적으로 동작

 

쉽게

불연속형 : 표현 방식이 상위 차원 배제된 상태로 하위 차원의 값으로 집계되어 보여지냐,

연속형 : 상위 차원 개입된 상태로 하위 차원 집계되어 이어지는 형식으로 보여지냐의 차이

좌 : 불연속 / 우 : 연속

 

 

학습하며 이해한 대로 적어봤는데, 혹시 잘못된 부분 있다면 지적 부탁드립니다👶🏻

 

1.6 많이 사용하는 DATE 함수?

weekday() : 월화수목금 숫자로 변환시켜 주는 것

 

날짜 형식 바꾸는 법 : [기본 속성] - [날짜 형식]

 

DATEPARSE() :

20210321

YYYYMMDD

2021-03-21

YYYY-MM-DD

 

STRING으로 바꾸는 법 : LEFT(STR(DATE),4)

왜 STR로 바꾸고 LEFT로 자를까? → DATE가 다루기 어렵기 때문에 여러 오류들이 생길 수 있다!

때문에 텍스트 필드로 만들 때는 아예 STR로 변환

 

3. 과제 대시보드 보완 연구

3.1 기존 문제점

들어가기 전, 우리 팀의 GOOD HOST 선정 기준을 살펴보아야 한다

📌 GOOD HOST 선정 기준은?

 

1차 : hostid 별 핵심 지표 고려하여 Score 계산, 수식은 다음과 같다

 

(총 리뷰 수 * 평균 평점) / 보유 숙소 개수

 

2차 : hostid 별 보유하고 있는 평균 숙소 가격이 상위 20%인 호스트

 

위 조건을 적용하기 위해 다양한 방법을 시도해보며 발생한 문제점들이 존재하는데...

 

1차로 20% 필터링 후 Price로 다시 20% 필터링하는 과정에서

지역 필터를 걸어도 전체 값으로 계산된다는 점이었다!

 

LOD를 사용하는 과정에서 발생한 문제라고 생각되며 차후에 LOD를 배우게 된다면 처음부터 다시 구성해 보도록 하자

 

3.2 개선 방안

📌 RANK로

 

LOD를 사용하지 않고 SIZE()를 통해 행 개수를 반환받고, 2/10를 곱해주는 것으로 완전 raw 하게 목표를 달성하였다.

하지만 이 방법은 임시방편이고, 다양한 문제들이 발생할 수 있다고 멘토님께서 말씀하셨다!👻

 

멘토님 께서도 해결 방안을 찾아보신다고 말씀하셨고, 곧 LOD도 다시 배우니 추후에 재도전해보자💪🏻


참조

 

[1] RANK 사용법

https://tedparkdev.tistory.com/27

 

Tableau(태블로) - Rank 함수 사용하여 순위 표시

1. 데이터 보기 옆 아래 화살표 클릭 > 계산된 필드 만들기 2. 함수 입력 3. 만든 함수를 행에 추가 계산된 필드가 연속형으로 되어있어 아래 이미지와 같이 표시된다. 4. 계산된 필드를 불연속형으

tedparkdev.tistory.com

https://help.tableau.com/current/pro/desktop/ko-kr/calculations_tablecalculations_definebasic_runningtotal.htm#Rank

 

테이블 계산 유형

이 문서에서는 Tableau에서 사용할 수 있는 테이블 계산의 유형과 사용 시기에 대해 설명합니다

help.tableau.com

 

[2] 태블로 계산된 필드 주요 함수 - SIZE() 참고

https://datalking.tistory.com/18

 

[인프런] 웰컴 투 태블로 월드 - 3. 태블로의 주요 기능 익히기(계산된 필드)

개요 지난 포스팅에서는 Tableau에서 지도를 활용하여 대한민국 시도 및 시군구 시각화를 수행하는 방법, 행정구역 필드를 계층 구조로 만드는 방법, 마크 카드 밀도 방식으로 시각화했을 때의 특

datalking.tistory.com

https://blog.naver.com/PostView.naver?blogId=camoyun&logNo=222870259648 

 

[태블로] Tableau Functions 정리! (Number, String, Logical,Table calculation)

(거의) 모든 태블로 Function을 정리해봤다. (워낙 태블로 Help 페이지에 자세히 나와있지만, 너어무 많...

blog.naver.com

 

[3] 우선순위 기준으로 ORDERBY, PARTITION 사용하려 했는데 존재하지 않는 함수라 함

https://help.tableau.com/current/prep/ko-kr/prep_calculations.htm

 

세부 수준(LOD), 순위 및 분위 계산 만들기

참고: 버전 2020

help.tableau.com

 

[4] 컨텍스트 필터

https://help.tableau.com/current/pro/desktop/ko-kr/filtering_context.htm

 

컨텍스트 필터 사용

기본적으로 Tableau에서 설정한 모든 필터는 독립적으로 계산됩니다

help.tableau.com

 


💪🏻 좋았던 점, 앞으로 개선해야 할 점 (추가로 배워야 할 점)

 

📌 으악! PT 역량이 매우매우 부족하다....

자신감 있게 말하는 연습을 수시로 해보자 🐯

 

📌 LOD를 많이 사용할수록 늪에 빠지기 쉽다고 하셨다

꼭 필요한 상황에, 일단 뭔지 확실히 배우고 사용하도록 하자 🐻‍❄️

 

 

#유데미, #유데미코리아, #유데미부트캠프, #취업부트캠프, #부트캠프후기, #스타터스부트캠프, #데이터시각화 #데이터분석 #태블로

 

Comments