관리 메뉴

ilovechoonsik

[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #18 - 자격증 공부 #1 (230405) 본문

STARTERS 4기 🚉/TIL 👶🏻

[STARTERS 4기 TIL] 프로젝트 기반 태블로 실전 트레이닝 #18 - 자격증 공부 #1 (230405)

춘시기좋아 2023. 4. 8. 13:33

 

📖 오늘 내가 배운 것

 

Tableau Desktop Specialist 대비 정리

 


1. Tableau Desktop Specialist

1.1 시험 형식


● Number of questions: 45 multiple-choice and multiple-select items 

● Product Version: Currently testing on 2022.3
● Time Limit: 60 minutes (includes 3 minutes for reviewing the NDA). 
● Language(s) Offered: English, Japanese, and Simplified Chinese
● Passing Score: 750

 

 

1.2 출제 유형

  1. 데이터 준비 25% JOIN-Realation Ship 차이 설명해라~
  2. 데이터 탐색 및 분석 35% 어떤 차트 만들 때 차원 몇 개 필요하냐~
  3. 인사이트 공유 25%
  4. 태블로 개념 및 이론 이해 15%

실무에 유용한 게 2, 많이 틀리는 게 1,4 → 암기 위주! tds 파일 왜 쓰는지 등

 

1.3 예상 문제

Domain 1 : Connecting to and Preparing Data

1. 태블로 파일은 어디서 찾을 수 있고 저장되는지!

Documents - My Tableau Repository - Shape

 

2. 추출을 해서 좋은 점?

support laged data sets

help improve performance

support additional functionality??? - 추출을 하지 않으면? count distinct가 안 된다~ 거의 출제 안 되기는 함

provide offline access to your data set - 오프라인에서도 사용 가능!

 

3. 추출은 두 가지

tds, tdsx 들이 왜 사용되는지? 장점?

atds, tdsx는 groups, sets, calculated fields, bins, number formats and sort order 등이 저장되지만? 만들어 놓은 시각화는 전부 사라짐!

그럼 언제 사용할까? : 식들만 공유하고 싶을 때

조건 : 데이터 셋을 첨부시키지 않는 통합된 패키지 파일이 아님.

내가 x에게 넘긴다? 그럼 x가 데이터 셋이 있거나 cloud에 접속할 수 있어야 하고

DB에서 데이터 끌어올 수 있는 권한 즉, ACCESS가 있어야 함!

 

4. twb, twbx?

내 시각화 공유하고 싶을 때 twb, twbx 보내면 댐

베스트는? 당연 twbx

tds가 좋은 건 뭐냐? 시각화 공유 안 하고 식들만 공유할 수 있는 것

 

5. JOIN VS Relationship (블렌딩은?)

주황색으로 연결 되는 게 JOIN이 아님

JOIN : merge 되는 새로운 데이터 셋이 생성

→ 집계 전 테이블 창조

→ JOIN은 MAX 32개까지 가능

 

Relationship : 계약 관계!

→ LOD를 지키고 필요할 때만 끌어오는 것

→ LOD는 JOIN 시 행이 여러 개 더 생김으로 결과가 달라질 수 있음

→ 내가 이 친구를 연결하고 싶을 때만 필드 명 동일한 거 찾아서 끌어오는 것

Relationships : dynamic, flexible, noodels 라고 불림

 

6. Add Joins and unions

JOIN : Column이 증가

UNOIN : Row가 증가

→ UNION 조건 : Column 이름이 같아야 한다

 

7. Creating Blends

: LEFT JOIN과 동일하기 때문에 → Primary, Secondary가 중요하다!

Primary-Secondary가 중요한 JOIN은 OUTER

화살표 표시 - 프라이머리, 세컨더리 - 주황

링크 주황색 - 링크가 되어 있다는 뜻

필요 없으면 끌 수 있음

 

8. Rename a data field

시험 때는 태블로 킬 수 없기 때문에 순서, 작동되는 간단한 것들 써 놓는 거 좋음

특히 필드 이름 바꾸는 부분은 출제 빈도 수가 높다

(1) 데이터 원본에서 더블클릭해서 필드 이름 변경 double click the filed

(2) 아래 클릭하고 이름 바꾸기

(3) 시트에서 이름 바꾸기 → 엑셀 시트에서 실제로 바뀌지는 않음

 

9. Assign an alias to a data value

별칭은 무조건 차원에서만 만들 수 있다! measure에서 절대 만들 수 없음

 

만드는 두 가지 방법

(1) 왼쪽 탭에서 우클릭 - 별칭 편집

(2) 드래그 - 드롭 되어 있는 차원 우 클릭 후 별칭 편집

 

10. Dimension and measure

(1) numeric → measure

(2) qualitabtive data → dimension

(3) measure에서 dimension 바꿀 수 있나? 가능!

  • LOD에 영향을 줄 수 있는 건? 오직 Dimension
  • discrete filed 는 파랑! → 드래그 드롭 하면? header

 

Domain 2: Exploring and Analyzing Data

1. Create a line chart

- date - discrete에는 week number가 없다!

- date default chart = line chart

 

2. Create a scatterplot

- 원하는 차원을 세부사항에 넣어서 세분화할 수 있다! 쪼개기 가능

- 트랜드 라인 추가 가능

 

3. Create a dual axis chart / Create a combined axis chart

- dual axis chart / combined axis chart 차이?

dual aixs는 그냥 이중축, combined axis는 막대사탕 차트 같이 모양 바꿔서 결합하는 거!

근데 같냐고 물어보면? 같다~

 

- 자주 하는 실수 : 1. 축 동기화를 하지 않아 숫자 실수, 2. 이해를 어렵게 만듦

 

4. Create a map using geographic data

- filed 맵, symbol 맵 차이? 차이는 크기가 있냐 없냐 차이!

- symbol 맵은 size,color 같이 있을 수 있고

- 그냥 맵은 color로만 조정할 수 있다!

- geocoding?

실무에서 쓰는 데이터는 더러운 경우가 있다 → 어디선 서울, 서울특별시

그래서 때에 따라 위경도 수동 타이핑, 클릭해서 맞추는 법 있다.

한국 데이터를 갖고 있는데 언어가 영어면 미국으로 지역이 설정되는 경우가 있다. → Edit Location으로 맞춰줄 수 있다.

 

5. Organize dimensions into a hierarchy : 계층화의 장점

- 정렬해서 보기 편하다

- 쉽게 추가 제거할 수 있다.

- 계층이 맵에 줄 수 있는 장점! → city, state 등이 겹쳐서 ambiguous 라고 나오는 경우가 있다! → 계층을 설정해주면 자동으로 인식을 해서 이 문제를 해결해 줄 수 있다

 

6. Add a filter to the view

- 필터는 디폴트로 해당 시트에만 영향을 줌

- date filter는 원하는 연도만 선택 가능

- 모든 필터는 원래 independent 하다! 그렇지만 컨택스트 필터가 추가되면 나머지는 dependent!!!

 

7. Sorting and manual sort : 정렬하는 방법을 고르라는 문제가 나올 수 있음

- 위 메뉴 바에 asc, desc 버튼

- 그래프의 경우 header 옆에 버튼

- dimeansion 우 클릭 후 sort에서 조절

- manual sort는 다른 sort에 의해 변하지 않는다.

 

8. histogram

- 분포를 확인하기 위해 사용

- only need 1 measure to create a histogram

 

9. Trend lines offer 5 options!! 외우기

a. linear

b. logarithmic

c. expotential

d. polynomial

e. Power

 

10. reference lines 3 options 외우기

a. table

b. pane

c. cell

 

Domain 3 : Sharing Insights

1. Viz animation (2020.1에 생김)

a. format - animation

b. workbook default - 모두 적용 가능

c. separte sheet 따로 적용 가능

d. simultaneous animation - default! 실플하고 빠르다

e. sequential animation - 컴플렉스 차트를 스텝바이 스텝으로 보여주고 싶을 때, 오래 걸림

f. Unsupported browser and features - 무조건 외우기

  1. 인터넷 익스플로어 뺀 나머지 모든 웹브라우저에서 작동함!!!!!!!!
  2. map, polygon, and density marks in web browser!!! - 얘네는 웹 브라우저에서만 작동 안함
  3. 1,2번이 가장 중요

 

2. 대시보드 레이아웃

- Tiled, Floating 
a. 필터나 카테고리를 위에 줄이 두 개가 있는 곳을 잡고 웁직임

b. 대시보드 레이아웃을 디바이스를 이용해서 바꾸기
   1 디폴트 레이아웃이 좋음 왜냐하면 디바이스를 정하는 순간 어느 디바이스에서도 설정한 레이아웃으로 보여짐 
   2 Size phone에서는 fit width 사용을 추천함

c. Fixed size, range, automatic 배치


2. 대시보드 액션
a. Hover, menu, select 
b. Go to URL! (Hyperlink 삽입)


3. Creating Story 
a. a story is a sequence of visualizations that work together to convey information 
b. 하나의 스토리에는 하나의 시트 or 대시보드만 가능
c. Each individual sheet in a story is called a story point 

 

Domain 4: Tableau Server

1. Tableau Online

a. 돈 내고 만들 수 있는 서버! 회사가 돈 내고 사는 private한 공간

장점 : 데이터 소스 관리자를 1명 두고 편하게 관리할 수 있다. → 데이터 뽑아서 올리면 연결된 모든 대시보드 데이터 바뀜

a. 데이터 소스 관리 및 작업자 관리 유용
b. DB 데이터 관리 유용 데이터 변경 유용

 

2. 파일 형식 *

twb - 통합문서 : 통합문서가 공유할 수 있게 다운로드가 되는 것 → 시각화 있고 데이터가 없다

→ 데이터가 밑에 다 blank 처리되어 있다 (껍대기만 존재)

twbx - 패키지 통합문서 → 데이터와 시각화 전부 추출해오는 것

1-둘 다 똑같은 csv 파일이 있고, 권한이 있다면? 데이터 파일만 연결하면 되기 때문에 twb 나쁘지 않다

2-모든 컬럼이 같다는 전재하에 twb 낫밷

3-태블로 공식 뭐시기 에서는 무조건 twbx를 선호

 

 

tde, hyper - 추출 : hyper가 더 큰 추출 만들고, 빠른 추출 가능

→ 두 개 기능 똑같다! tde 특정 버전에서 업그레이드된 게 hyper

우측 사진에서 보이는 추출!

추출했을 때, 내 컴퓨터에 로컬하게 저장되는 게 tde,hyper

연결-추출로 바꾸고 시트 누르면 저장하라고 나오는 형식

 

 

 

 

 

 

추가로 추출 사용에 체크되어 있다면? 이미 tde or hyper가 있는 거

 

 

 

 

 

 

 

 

 

 

 

tds - 실제 데이터가 아니라 우리가 만든 계산된 필드, 그룹, 속성 변경 등이 그대로 저장이 된다!

→ 데이터 원본 파일이 붙어있지 않음, 때문에 동일한 파일이 있어야 함.

→ 시각화는 제외됨으로 이미 정제가 된 식, 속성, 그룹을 갖고 팀이 전부 다른 시각화 하고 싶을 때 사용!

 

tdsx - (tds + hyper, tde)

→ tds를 포함할까요? 문제 나올 수 있는데, 맞다! tds의 모든 걸 포함

→ 데이터는 포함되어 있지만 시각화는 사라져 있다.

→ 둘의 차이는 원본 데이터 파일이 있고 없고 (hyper, tde 포함 여부)

 

tde, hyper 동일한 데이터로 여러 개 만들 수 있는지?

→ 이름만 바꾸면 만들 수 있다.

data > 연결된 데이터 > Add to Saved Data Sources

 


💪🏻 좋았던 점, 앞으로 개선해야 할 점 (추가로 배워야 할 점)

 

📌 태블로 자격증을 취득하기 위한 본격적인 공부를 시작했다!

모의고사 점수가 처참한데.. 그만큼 더 노력해서 주말까지 꼭 취득할 수 있도록 해야겠다ㅎㅎ

 

 

#유데미, #유데미코리아, #유데미부트캠프, #취업부트캠프, #부트캠프후기, #스타터스부트캠프, #데이터시각화 #데이터분석 #태블로

Comments