ilovechoonsik
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #8 - ATTR, 결합된 필드(차원 정렬), 집합과 필터, VLOD 이론 (230322) 본문
[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #8 - ATTR, 결합된 필드(차원 정렬), 집합과 필터, VLOD 이론 (230322)
춘시기좋아 2023. 3. 22. 17:43
📖 오늘 내가 배운 것
1. ATTR
2. 결합된 필드 - 차원 정렬 (nested setting)
3. 집합과 필터
4. 간단 VLOD 이론
1. ATTR
1.1 단일 값만 존재하는 행 찾기 - 한번만 팔린 제품 구하기
EX) 인기가 없는 물건은 종류 별로 2개씩 놓는다!
→ 그리고 tracking을 한당
위처럼 Order ID를 ATTR로 필터를 걸어준다면?
단일 행만 확인하는 것도 가능하다!
1.2 문자열에 대한 집계를 수행 - 같은 차원 다른 집계
CENTRAL은 집계로 보고 싶은데
EAST, S, W는 특성으로 보고 싶다면?
Region이 Central 일 때, SUM(Sales)
아닐 때는 AVG(Sales)
1.3 도구 설명에 ATTR
대시보드 보는 사람들은 필드 뭐 있는지 모른다.
이 사람들을 위해 카테고리 별로 뭐가 들어있는지 테이블 감을 잡게 해주려면?
도구 설명에 특성으로 하위 카테고리 넣어주면 다중, 단일 파악 가능
2. 결합된 필드 - 차원 정렬 (nested setting)
카테고리 별 State별로 Sales가 가장 많은 순으로 앞으로 오게 하고 싶다면?
결합된 필드 사용해야 함
1. State/Province, Category [결합된 필드]로 만든 후 [세부 정보에 드래그 드롭] - [정렬]
2. 색상에 State/Province
결합된 필드 사용 전에는 같은 주가 같은 곳에 배치됐었는데!
Sales의 크기 대로 정렬이 잘 된 것을 확인할 수 있다!
그렇다면 요건 언제 사용해야 할까?
- 정렬 오름차순, 내림차순 했을 때
- 디테일하게 정렬이 안 걸릴 때
텍스트 테이블은?
- 결합된 필드 기준으로 생성
3. 집합과 필터
3.1 집합이란?
IN/OUT을 정의하여 VLOD에서 값을 분리시켜 주는 녀석
📌 예시를 통해 알아보기
1. 매개 변수 생성 후 [우 클릭] - [만들기] - [집합]
2. 집합의 기준이 되는 차원 [우클릭] (예시에는 Customer Name의 sales 활용) - [집합 수식 생성]
3. 만든 집합을 색상으로!
4. [sales thres에 설정하는 sales]보다 sum(sales)가 높은 Customer Name의 색상이 표현된다.
3.2 집합과 T/F FILTER 차이
필터는 나누고 제외시키는 거! -> 관심 있는 데이터만 보고 나머지는 제외~
집합은 보고 싶은 것만 보는 것! -> 기준만 정하고 다 보여주는 것
📌 우선순위?
집합 > 필터
집합이 상위 개념
📌 집합을 필터로?
집합을 필터로 놓고 IN 선택하면 필터링된다!
T/F 필터 + FIXED = 집합
📌 예시 살펴보자~
집합과 동일한 계산식으로 만들어진 차원을 색상으로 걸어주면?
위와 같은 결과를 보여준다
이렇게만 봐서는 확 와닿지 않는데.. 열에 카테고리를 추가해서 좀 더 세부적으로 확인해보자.
📌 이제 명확한 차이를 확인할 수 있다!
집합 : 집계된 값으로 IN/OUT을 쓴다 → 단점은 집계된 값이기 때문에 대시보드가 어그러질 수 있다. 잘 쓰면 강력함
아무리 FEATURE를 추가하고 세분화해도 기준은 집계된 값! Customer Name의 총합계만 넘으면 무조건 IN으로 표시
T/F : VLOD 즉, 내가 지금 보는 차원 기준의 SUM(SALES)가 기준! 이게 설정 값 넘냐 안 넘냐
현재 위에 T/F 기준을 CUSTOMER NAME으로 안 뒀다
📌 T/F 필터에서 FIXED
이제 왜 T/F 필터 + FIXED = 집합이라 하는지 살펴보자~
FIXED로 Customer Name을 고정시켜 SUM(Sales)를 구하는 것으로 현재 VLOD인 Category는 고려하지 않고,
[Customer Name의 SUM(Sales)]가 sales thres 보다 큰 경우 전부 참
즉, FIXED LOD + FILTER의 기능이 합쳐져야 집합이 되는 거
📌 그럼 집합을 왜 쓰냐?
→ 퍼포먼스 테스트에서 집합이 우위이기 때문
차트를 완성시키는 대에는 다양한 방법이 있다, 정답은 없고 상황 별로 잘 선택해서 사용하면 된다.
3.3 집합 활용
두 번째 사진에 우측에 집합으로 표현된 IN 부분은? (집합 : Customer Name 기준 SUM(Sales) > sales thres)
sales thres를 넘는 CUSTOMER NAME 들의 SALE 총합계
→ 각 Category 별로 차지하는 비율로 사용할 수도 있다!
4. 간단 VLOD 이론
4.1 VLOD?
VLOD : 열, 행에 놓인 내가 보는 차원
조정할 수 있는 거? → 무조건 차원 밖에 없다
차원을 어디다 넣어야 하나? → 열, 행, 필터 등등
가장 많이 사용되는 LOD는 FIXED
4.1 INCLUDE / EXCLUDE
(1) INCLUDE : 차원을 포함시키는 기능
📌 하위 차원을 VLOD에 보이지 않는 뒷단에 추가하고 싶다?
📌 하위 범주 포함해서 AVG SSALES 구하기
📌 뒷단에서 일어나는 일?
→ 하위 범주에서 평균을 구한다
EX) 가구의 서브 카테고리 총매출 / 서브 카테고리 개수 = 가구 평균
즉, 기존에 RAW 데이터까지 가지 않는다!
그냥 평균은?
→ RAW 데이터 값 가져와서 평균
INCLUDE로 정의한 차원의 평균?
→ INCLUDE에 정의한 차원이 RAW
(2) EXCLUDE : 차원 제외하는 기능
상위 차원을 VLOD에 보이지 않는 뒷단에 추가하고 싶다? EXCLUDE
INCLUDE는 하위 범주 평균을 다시 평균을 내서 위로 끌어오는 거
EXCLUDE는 상위 범주의 평균을 끌어내리는 것
어떤 범주를 기준으로 그 평균값을 고정시켜서 분모로 사용하고 싶을 때 사용
→ 즉, 기여도! 상위 범주에서 차지하는 비율을 구할 때 유용함
ex) 상위 범주에서 하위 범주가 차지하는 비율
LOD를 100% 이해하면 다양하게 사용할 수 있다!
근데 지금 초보니까 SECTION 나누고 외우기
평균 세분화 : INCLUDE
기여도 : EXCLUDE
차원 고정해서 기준으로 보고 싶어? : FIXED
💪🏻 좋았던 점, 앞으로 개선해야 할 점 (추가로 배워야 할 점)
📌 오늘 배운 내용들은 강사님의 설명을 들었을 때 이해된 듯 싶다가도
혼자 사용하려 하면 머리가 복잡해지는 개념들이었다.
다양한 케이스 스터디를 진행해 보며 익숙해질 수 있도록 하자!👻
#유데미, #유데미코리아, #유데미부트캠프, #취업부트캠프, #부트캠프후기, #스타터스부트캠프, #데이터시각화 #데이터분석 #태블로