관리 메뉴

ilovechoonsik

유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지 본문

STARTERS 4기 🚉/학습일지 😛

유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지

춘시기좋아 2023. 3. 26. 23:52

[출처 : Udemy - STARTERS 블로그 학습일지 안내]

 

 

1. 이번 주에 어떤 것을 배웠나요? 겪은 시행착오/어려운 점은?

1.1 태블로 테크닉

1. 테이블 계산 유용한 함수

차원 집계 - MIN, MAX, COUNT, COUNTD

측정값 집계 - SUM AVG VAR VARP

PRIMARY 함수 - TOTAL LOOK UP, RUNING, WINDOW, PREVIOUS_VALUE

PARTITION 나누는 함수 - INDEX, FIRST(WINDOW 함수 사용 가능), LAST

RANK 함수 - RANK(111 4), RANK_DENSE(111 2), RANK_UNIQUE(1234) - 실무에서 많이 쓰이는 건 RANK/RANK_DENSE! UNIQUE는 공정하지 않을 수 있기 때문

 

2. 퀵 테이블 계산

사용할 데이터가 모두 VLOD에 존재한다면? 그리고 해당 시트가 그대로 대시보드에 보여진다면? 퀵 테이블 계산은 아주 유용하다! 단, 계산 방향 설정 주의

 

📌 사용하면 혼란을 야기할 수 있는 경우

- 동작, 필터링, 차원 고정 등의 작업이 수행되는 경우

- 하나의 텍스트로 보여지는 경우

 

3. Primary 함수

TOTAL() : (계산식)의 총계

LOOK UP() : 기준 행에서 LOOK UP할 행 지정, 해당 값 반환

RUNING_SUM/AVG() : 누적합, 누적평균

WINDOW_SUM/AVG() : 지정한 범위 별 계산

PREVIOUS_VALUE() : 이전 행의 값을 반환! ()안에 값은 +연산 작용

RANK() : 순위 매겨주는 함수

 

# Primary 함수는 화면에 없으면 확인할 수 없다
ex) 누계 같은 경우 이전 행 데이터 제외하고 누계만 볼 수 없음

 

4. 날짜 필터링

MoM, YoY : 이전 달, 연도와 수치 비교

MTD, QTD, YTD : 달, 분기, 연도 단위에서 일반적으로 day 기준 사용하여 수치를 합계, 나열

 

5. ATTR

📌 ATTR?

: 현재 VLOD에서 이 필드가 단 하나의 값을 가지냐, 복수의 값을 가지냐, 단 하나의 값을 가지면 그것을 가지고 오고 아니면 *을 가져와라 - 이질성 TEST

 

📌 ATTR 특성

: ATTR은 집게 함수, 결과가 VLOD에서 결정된다(VLOD에 따라 결과값이 달라진다)

 

6. 결합된 필드 (차원 정렬)

- 카네고리별 Sales 바 차트에 지역이 색상으로 들어가 있다면? 단순 정렬로는 Sales가 큰 지역 순으로 정렬하는 게 불가능

- 정렬하고 싶다면 결합된 필드를 사용해야 한다~

 

📌 사용법

: 현재 세분화 수준의 차원을 결합된 필드로 만들고 세부 정보에 넣은 후 정렬

 

7. 집합과 필터

📌 집합

: 보고 싶은 것만 봄, 기준만 정해서 구분하고 다 보여줌

- 집계된 값으로 IN/OUT을 쓴다

- 다양한 차원으로 세분화 해도 기준은 집계된 값

- 집계된 값이기 때문에 대시보드에 혼란을 줄 수 있다.

 

📌 필터

: 나누고 제외, 관심 있는 데이터만 확인

- VLOD, 내가 지금 보는 차원 기준에서 조건 적용!

- 단순히 보여지는 값이 기준을 넘는지, 안 넘는지에 대한 거

- T/F 필터 + FIXED = 집합

 

📌 우선 순위?

: 집합 > 필터

 

8. VLOD 이론

📌 VLOD

: 열, 행에 놓인 내가 현재 보고 있는 차원

 

📌  조정하려면?

- 무조건 차원으로 조정

- 차원은 열, 행, 필터 등에 넣으면 되고

- 좌측 하단 마크가 바뀌는 모든 기능 = VLOD 조정 가능

 

9. LOD

📌 INCLUDE

: 차원을 포함시키는 기능

하위 차원을 상위 차원에서 활용 - 평균 세분화

 

📌 EXCLUDE

: 차원을 제외하는 기능

상위 차원을 하위 차원에서 활용 - 기여도

 

📌 FIXED

: 내가 원하는 특정 차원으로 차원을 고정시키는 것

INCLUDE, EXCLUDE 전부 가능 (특정 상황에서 불가능)

 

📌 주의할 점

1. LOD 사용 시 RAW 데이터를 꼭 확인해야 한다!

2. INCLUDE, EXCLUDE는 필터 영향을 다 받음!

 

1.2 태블로 작업의 우선순위

출처 : 태블로 공식 문서

 

태블로는 각각의 작업에 대한 우선순위를 지니고 있다!

차원-측정값을 이해하는 것과 비슷한 정도의 중요도를 갖는다고 생각되는 부분이니 꼭 숙지하고 고려하여 작업을 수행하도록 해야 한다.

 

1.3 조별 과제

(1) 우리는?

: 회사의 상품 세일즈 트래킹 팀

 

(2) 우리의 목표

: LOD + 그동안 배운 방법을 사용하여서 다양한 뷰포인트로 어느 sub-category or category or product가 잘하고 있는지 어디서 어떻게 집중해야 하는지 파악하고 싶다!

조건은, EXCLUDE/INCLUDE와 FIXED가 사용된 각각의 대시보드 1개씩 생성

 

(3) 1번 대시보드

 

1. 세일즈 트랙킹 담당자로서 전체적인 sales, profit 현황을 수치-시계열로 확인할 수 있다

2. 카테고리 별 매출-수익 관계 파악을 통해 순수익이 부족한 카테고리를 확인할 수 있다

3. 각 카테고리가 월 별로 얼마나 팔리는지 확인할 수 있다.

 

(4) 2번 대시보드

1. 지역 별 매출 분포를 확인할 수 있다

2. 전체 지역 or 선택한 지역의 카테고리 별 매출과 타 카테고리 대비 얼마나 팔리고 있는지 직관적으로 확인할 수 있다.

3. 전체 지역 or 선택한 지역의 카테고리에 대해 기존 고객의 잔존율 및 신규 고객 구매율을 확인할 수 있다.

 


시행착오/어려운 점?

📌 태블로 다양한 테크닉 및 작업 우선순위

 

 태블로를 공부하며 드는 생각 중 가장 많은 비중을 차지하는 부분이 "무엇을 하든 그 배경이 되는 원리와 개념을 완벽히 파악해야 될 거 같다"와 "간단하게 구현할 수 있을 거 같은 작업들이 안 되는 경우가 많다" 이다..!

 기존에 다른 분들의 코드를 가져다 쓰며 학습했던 Python, SQL의 경우 각 개념들을 하나하나 딥하게 파고 들어가 학습하지 않아도 사용하는데 무리가 없었고, 또 사용하다 보면 빠르게 내 것이 되곤 했다. 그러나 태블로는 좀 다른 거 같다! 내 이해력이 좋지 않은 것도 한몫하겠지만, 대시보드를 구성하기 위해 완벽히 이해하지 못한 채로 그대로 가져와 사용한 다양한 코드, 개념, 원리들은 잘 동작되는 가 싶다가도 끝내 발목을 붙잡기 때문이다😵

 태블로를 이제 막 공부하기 시작한 지금 시점의 나에게는 대시보드를 완성하기까지의 과정이 높은 건축물을 세우는 과정과 같다고 느껴지며, 그렇기에 지금까지 학습한 도구 중 기초 및 기반을 제일 탄탄하게 해야 하는 도구로 보여진다

 

📌 조별 과제

 

1. 주제에 대한 초기 가닥을 잡는 것에 어려움

2. 태블로에서 원하는 바를 구현하는 기술력 부족

3. 대시보드 디자인 능력 부족

 

 이번 프로젝트는 초기 가닥을 잡는 것부터 쉽지 않았다. LOD가 중심이 되는 대시보드 구성이 목표로, EXCLUDE/INCLUDE와 FIXED를 각 대시보드에 적절히 녹여내야 했기 때문에 인사이트와 기술 구현의 관점 사이에서 고민을 많이 했던 거 같다.

 또한 원하는 바를 기술적으로 구현하는 데 어려움을 겪었다. 기존에 배웠던 내용들을 응용하면 쉽게 해결할 수 있었을 만한 부분들이었는데, 떠올리고 응용하는 게 쉽지 않았다.

 마지막으로 대시보드 디자인 역량이 매우 부족하다는 사실을 깨달았다.. 이제라도 깨달아서 다행이고 꼭 보완할 수 있도록 하자!

 

 지난 주 감기에 걸린 이후 쭉 컨디션이 좋지 않아 골골대며 생산성이 많이 떨어진 상태였는데, 똑똑하고 멋진 팀원 분들이 많은 도움을 주셔서 짧은 시간이었지만 결국 괜찮은 아웃풋을 낼 수 있었고 그 과정에서 다양한 것들을 배울 수 있어 매우 유익한 시간이었다!  팀원분들 정말 고생 많으셨고, 완전 감사했습니다🥰

 

2. 앞으로 적용해야겠다고 느낀 점이 있다면 무엇이고, 어떻게 해보면 좋을까요?

2.1 작업 우선순위 고려

 태블로 교육을 들으며 측정값 - 차원의 관계와 더불어 저엉말 중요하다고 생각된 부분이다!

 태블로 고수 분들이 대시보드 구성까지 어떻게 작업하고 계신지 모르겠지만, 지금 나의 경우 머리로 완벽하게 파악하고 구성하는 게 불가능하기에 작성한 청사진을 따라 시트를 구성할 때 작업 순서에 의해 어그러질 수 있는 요소들은 기록/정리를 하며 구성하는 게 바람직하다고 생각된다. 특히 차원은 그렇다!

 실제로 차원과 작업 우선순위의 무서움을 모르고 덤벼들었던 에어 비앤비 대시보드 프로젝트에서  Fixed, Context Filter 등의 다양한 문제가 가중되어 처음부터 뜯어고쳐야 하는 불상사가 발생한 적이 있다..

 자주 사용되는 작업 우선순위는 꼭 기억해 두고, 작업 수행 시 필히 기록하는 습관을 들여보자!

 

2.2 나만의 대시보드 틀, 디자인 만들기

 지금까지 팀 프로젝트를 하면서 초기에 청사진을 구성하고 각 시트를 제작하는 부분에만 신경을 썼지 최종 대시보드의 디자인을 연구해 본 경험이 없었다...(사실 이번 프로젝트에서 호기롭게 도전했지만 팀원들의 놀림?을 받으며 그대로 철거됐다💀)

 이 부분은 그냥 넘어갈 수 없는 심각한 문제인데, 시각화의 본질 중 가장 중요한 요소인 쉽고 빠른 이해와 전달력을 녹여내는 능력이 부족하다는 뜻이기 때문이다. 앞으로는 팀 프로젝트에서 대시보드 구성, 디자인을 담당하지 못하게 되더라도 결과물을 다시 나만의 대시보드로 재구성하는 연습을 수행하며 시각적으로 매끄럽게 표현하는 능력을 길러야겠다!

 또한 대시보드를 보시는 분들이 데이터와 분석 기법을 전혀 모르시는 분들이라 가정하고 누가 봐도 전달하고자 하는 바를 쉽게 파악할 수 있도록 하는 연습도 함께 하면 좋을 거 같다.

 

2.3 다양한 데이터로 대시보드 만드는 연습

 앞서 발생했던 모든 문제들을 해결하기 위한 방안으로는 최대한 다양한 데이터로, 최대한 다양한 기법/차트들을 사용해서 대시보드를 구성하는 것이다. 이 부분은 너어무 중요한 부분이라 잠을 줄여서라도 어떻게든 수행하고자 한다! 제발 빠이팅💪🏻

 

3. 현재까지의 학습 평가 및 다음 학습을 위한 다짐/목표를 공유해 주세요.

3.1 학습 평가

📌 배운 내용을 떠올리고 활용하는 능력 부족

📌 다양한 데이터를 통해 대시보드를 구성하는 훈련 필요

 

3.2 다짐 및 목표

🔥 핵심 기법들 cheat sheet 제작😺

🔥 주당 2개 대시보드 제작🐼

🔥 최대한 남아서 학습🦊

 


* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL 
* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb 
본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
 

#유데미, #유데미코리아, #유데미부트캠프, #취업부트캠프, #부트캠프후기, #스타터스부트캠프, #데이터시각화 #데이터분석 #태블로

Comments