관리 메뉴

ilovechoonsik

[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #8 - ATTR, 결합된 필드(차원 정렬), 집합과 필터, VLOD 이론 (230322) 본문

STARTERS 4기 🚉/TIL 👶🏻

[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #8 - ATTR, 결합된 필드(차원 정렬), 집합과 필터, VLOD 이론 (230322)

춘시기좋아 2023. 3. 22. 17:43

 

📖 오늘 내가 배운 것

 

1. ATTR

2. 결합된 필드 - 차원 정렬 (nested setting)

3. 집합과 필터

4. 간단 VLOD 이론

 


1. ATTR

1.1 단일 값만 존재하는 행 찾기 - 한번만 팔린 제품 구하기

EX) 인기가 없는 물건은 종류 별로 2개씩 놓는다!

→ 그리고 tracking을 한당

위처럼 Order ID를 ATTR로 필터를 걸어준다면?

단일 행만 확인하는 것도 가능하다!

 

1.2 문자열에 대한 집계를 수행 - 같은 차원 다른 집계

CENTRAL은 집계로 보고 싶은데

EAST, S, W는 특성으로 보고 싶다면?

Region이 Central 일 때, SUM(Sales)

아닐 때는 AVG(Sales)

 

1.3 도구 설명에 ATTR

대시보드 보는 사람들은 필드 뭐 있는지 모른다.

이 사람들을 위해 카테고리 별로 뭐가 들어있는지 테이블 감을 잡게 해주려면?

도구 설명에 특성으로 하위 카테고리 넣어주면 다중, 단일 파악 가능

 

2. 결합된 필드 - 차원 정렬 (nested setting)

카테고리 별 State별로 Sales가 가장 많은 순으로 앞으로 오게 하고 싶다면?

결합된 필드 사용해야 함

 

1. State/Province, Category [결합된 필드]로 만든 후 [세부 정보에 드래그 드롭] - [정렬]

 

2. 색상에 State/Province

결합된 필드 사용 전에는 같은 주가 같은 곳에 배치됐었는데!

Sales의 크기 대로 정렬이 잘 된 것을 확인할 수 있다!

 

그렇다면 요건 언제 사용해야 할까?

- 정렬 오름차순, 내림차순 했을 때

- 디테일하게 정렬이 안 걸릴 때

 

텍스트 테이블은?

- 결합된 필드 기준으로 생성

 

3. 집합과 필터

3.1 집합이란?

IN/OUT을 정의하여 VLOD에서 값을 분리시켜 주는 녀석

 

📌 예시를 통해 알아보기

1. 매개 변수 생성 후 [우 클릭] - [만들기] - [집합]

2. 집합의 기준이 되는 차원 [우클릭] (예시에는 Customer Name의 sales 활용) - [집합 수식 생성]

 

3. 만든 집합을 색상으로!

4. [sales thres에 설정하는 sales]보다 sum(sales)가 높은 Customer Name의 색상이 표현된다.

 

3.2 집합과 T/F FILTER 차이

필터는 나누고 제외시키는 거! -> 관심 있는 데이터만 보고 나머지는 제외~

집합은 보고 싶은 것만 보는 것! -> 기준만 정하고 다 보여주는 것

 

📌 우선순위?

집합 > 필터

집합이 상위 개념

 

📌 집합을 필터로?

집합을 필터로 놓고 IN 선택하면 필터링된다!

T/F 필터 + FIXED = 집합

 

📌 예시 살펴보자~

집합과 동일한 계산식으로 만들어진 차원을 색상으로 걸어주면?

위와 같은 결과를 보여준다

 

이렇게만 봐서는 확 와닿지 않는데.. 열에 카테고리를 추가해서 좀 더 세부적으로 확인해보자.

좌 : 집합 / 우 : T/F 필터

 

📌 이제 명확한 차이를 확인할 수 있다!

 

집합 : 집계된 값으로 IN/OUT을 쓴다 → 단점은 집계된 값이기 때문에 대시보드가 어그러질 수 있다. 잘 쓰면 강력함

아무리 FEATURE를 추가하고 세분화해도 기준은 집계된 값! Customer Name의 총합계만 넘으면 무조건 IN으로 표시

 

T/F : VLOD 즉, 내가 지금 보는 차원 기준의 SUM(SALES)가 기준! 이게 설정 값 넘냐 안 넘냐

현재 위에 T/F 기준을 CUSTOMER NAME으로 안 뒀다

 

📌 T/F 필터에서 FIXED

 

이제 왜 T/F 필터 + FIXED = 집합이라 하는지 살펴보자~

FIXED로 Customer Name을 고정시켜 SUM(Sales)를 구하는 것으로 현재 VLOD인 Category는 고려하지 않고,

[Customer Name의 SUM(Sales)]가 sales thres 보다 큰 경우 전부 참

 

즉, FIXED LOD + FILTER의 기능이 합쳐져야 집합이 되는 거

 

📌 그럼 집합을 왜 쓰냐?

→ 퍼포먼스 테스트에서 집합이 우위이기 때문

차트를 완성시키는 대에는 다양한 방법이 있다, 정답은 없고 상황 별로 잘 선택해서 사용하면 된다.

 

3.3 집합 활용

좌측 : T/F 필터 / 우측 : 집합

 

두 번째 사진에 우측에 집합으로 표현된 IN 부분은? (집합 : Customer Name 기준 SUM(Sales) > sales thres)

 

sales thres를 넘는 CUSTOMER NAME 들의 SALE 총합계

→ 각 Category 별로 차지하는 비율로 사용할 수도 있다!

 

4. 간단 VLOD 이론

4.1 VLOD?

 

VLOD : 열, 행에 놓인 내가 보는 차원

조정할 수 있는 거? → 무조건 차원 밖에 없다

차원을 어디다 넣어야 하나? → 열, 행, 필터 등등

 

가장 많이 사용되는 LOD는 FIXED

 

4.1 INCLUDE / EXCLUDE

(1) INCLUDE : 차원을 포함시키는 기능

 

📌 하위 차원을 VLOD에 보이지 않는 뒷단에 추가하고 싶다?

 

📌 하위 범주 포함해서 AVG SSALES 구하기

 

📌 뒷단에서 일어나는 일?

→ 하위 범주에서 평균을 구한다

EX) 가구의 서브 카테고리 총매출 / 서브 카테고리 개수 = 가구 평균

즉, 기존에 RAW 데이터까지 가지 않는다!

 

그냥 평균은?

→ RAW 데이터 값 가져와서 평균

 

INCLUDE로 정의한 차원의 평균? 

→ INCLUDE에 정의한 차원이 RAW

 

(2) EXCLUDE : 차원 제외하는 기능

 

상위 차원을 VLOD에 보이지 않는 뒷단에 추가하고 싶다? EXCLUDE

INCLUDE는 하위 범주 평균을 다시 평균을 내서 위로 끌어오는 거

EXCLUDE는 상위 범주의 평균을 끌어내리는 것

어떤 범주를 기준으로 그 평균값을 고정시켜서 분모로 사용하고 싶을 때 사용

→ 즉, 기여도! 상위 범주에서 차지하는 비율을 구할 때 유용함

ex) 상위 범주에서 하위 범주가 차지하는 비율

 

LOD를 100% 이해하면 다양하게 사용할 수 있다!

 

근데 지금 초보니까 SECTION 나누고 외우기

평균 세분화 : INCLUDE

기여도 : EXCLUDE

차원 고정해서 기준으로 보고 싶어? : FIXED


💪🏻 좋았던 점, 앞으로 개선해야 할 점 (추가로 배워야 할 점)

 

📌 오늘 배운 내용들은 강사님의 설명을 들었을 때 이해된 듯 싶다가도

혼자 사용하려 하면 머리가 복잡해지는 개념들이었다.

다양한 케이스 스터디를 진행해 보며 익숙해질 수 있도록 하자!👻

 

 

#유데미, #유데미코리아, #유데미부트캠프, #취업부트캠프, #부트캠프후기, #스타터스부트캠프, #데이터시각화 #데이터분석 #태블로

Comments