목록STARTERS 4기 🚉/TIL 👶🏻 (52)
ilovechoonsik

📖 오늘 내가 배운 것 22일에 배운 LOD를 세부적으로 살펴보는 시간! 1. LOD Include, Exclude 예제 2. LOD 사용 시 집계 이유 3. LOD Fixed 이론 & 예제 4. LOD Fixed, Include 어떻게 다른가? # 들어가기 전 LOD를 사용하려면 1. RAW 데이터를 꼭 확인해야 한다! 2. INCLUDE, EXCLUDE는 필터 영향을 다 받음! → 필터 영향 다 받은 다음에 Score 측정하고 여기서 상위 20% 확인하면? 문제가 생길 수 있음 이상이 생겼을 경우 RAW COUNT 해봐야 함! → index() 앞에 삽입하고 필터링 여부 확인하기 (필터링 된 거 숫자 빠져있기 때문에 확인 가능) 1. LOD Include, Exclude 예제 1.1 INCLUDE (..

📖 오늘 내가 배운 것 1. ATTR 2. 결합된 필드 - 차원 정렬 (nested setting) 3. 집합과 필터 4. 간단 VLOD 이론 1. ATTR 1.1 단일 값만 존재하는 행 찾기 - 한번만 팔린 제품 구하기 EX) 인기가 없는 물건은 종류 별로 2개씩 놓는다! → 그리고 tracking을 한당 위처럼 Order ID를 ATTR로 필터를 걸어준다면? 단일 행만 확인하는 것도 가능하다! 1.2 문자열에 대한 집계를 수행 - 같은 차원 다른 집계 CENTRAL은 집계로 보고 싶은데 EAST, S, W는 특성으로 보고 싶다면? Region이 Central 일 때, SUM(Sales) 아닐 때는 AVG(Sales) 1.3 도구 설명에 ATTR 대시보드 보는 사람들은 필드 뭐 있는지 모른다. 이 사람..

📖 오늘 내가 배운 것 1. 지금까지 배웠던 내용 간단 정리 2. 퀵 테이블 계산 3. 날짜 필터링 및 MTD QTD YTD 4. ATTR 5. 과제 날짜 매개변수 활용 대시보드 1. 배웠던 함수 차원 집계 - MIN, MAX, COUNT, COUNTD 측정값 집계 - SUM AVG VAR VARP PRIMARY 함수 - TOTAL LOOK UP, RUNING, WINDOW, PREVIOUS_VALUE PARTITION 나누는 함수 - INDEX, FIRST(WINDOW 함수 사용 가능), LAST RANK 함수 - RANK(111 4), RANK_DENSE(111 2), RANK_UNIQUE(1234) - 실무에서 많이 쓰이는 건 RANK/RANK_DENSE! UNIQUE는 공정하지 않을 수 있기 때문..

📖 오늘 내가 배운 것 1. 과제 발표 및 피드백 2. 태블로 테크닉 3. 과제 대시보드 보완 연구 1. 과제 발표 및 피드백 1.1 PT 시 중요한 부분 (1) 배경 및 목표 부터 잘 잡고 들어가야 한다! 여기 맘에 안 들면 공격이 나옴 (2) 말할 때, TOP DOWN 식으로! 1. 들어가기 전 데이터 셋 간단하게라도 이야기 : 2013~2014년 무슨무슨 데이터 활용했습니다, 총매출은 얼마입니다! 2. 데이터가 많다면? : 정확한 결과를 도출하기 위해 노력했다. 3. 1을 이야기 하면 1의 반대 까지 이야기 : 충성 고객 화이트 리스트 기반으로 이렇게저렇게 진행하겠다! 왜 블랙 리스트는 신경 쓰지 않아요? → 이런 질문에 대답할 수 있어야 함. ex) 블랙 리스트 제거 비용이 막대하다 📌 우리 조 ..

📖 오늘 내가 배운 것 1. 과제 발표 및 피드백 2. 태블로 테크닉 3. 과제 대시보드 보완 연구 1. 과제 발표 및 피드백 1.1 과제 발표 더보기 1. 목표 및 현황 저희 조는 이 프로젝트의 목표를 호스트 맞춤형 관리 전략으로 정했는데요.이 대시보드를 직접 에어비앤비 매니저들이 관리하면서 Bad, good host들의 정보를 쉽게 보면서 관리할 수 있도록 하였습니다. 우선 현재 에어비앤비의 현황을 보시면, 매년 호스트의 등록 수가 증가하고 있는데요. 사실 좋은 호스트만 증가한다면 아주 좋지만 그렇지 않은 호스트들의 증가는 무분별한 서버 비용 낭비로 이어질 수 있습니다. 그래서 이런 호스트들을 Bad host로 선별하여 경고 조치나 서비스의 퀄리티가 좋아질 수 있도록 가이드라인 제시를 해서 서버 비용..

📖 오늘 내가 배운 것 1. 과제 피드백 2. 간단 시각화 방안 3. 금일 과제 1. 과제 피드백 1.1 전체적인 과제 피드백 딱 보고 이해 못 할 거 같으면 아래 작동 방법 설명 적어주기 직원들이 어느 정도 인지하고 있는 정보에 대해서는 앞/뒤 고려해보기 1.2 우리 조 피드백 맵에 색칠 대신 원으로 변경, 어느 구역에 몇 명 있는지 확인할 수 가 없다… 대소문자 통일 , 색, 원 크기 조절 (많이 쓰면 정신 없음), 숫자 2개만 있어도 될 거 같다. 2. 간단 시각화, 꿀팁 2.1 중복 문제 태블로는 뭐든 집계시켜버리는 성질이 있다! 잘 못 추출한 데이터는 중복 문제를 야기시킬 수 있는데 확인하는 방법은? COUNT(~) COUNTD() (여기서 D는 DISTINCT) 2.2 UNION 테이블 전체 ..

📖 오늘 내가 배운 것 1. 과제 피드백 2. 간단 시각화 방안 3. 금일 과제 1. 과제 피드백 1.1 전체적인 과제 피드백 전 달보다 크게 수익이 늘어난 호스트 오래되었지만 수익이 안 나거나 리뷰가 떨어진 호스트 집중 관리 첫 두 달은 리뷰에서 제외하기 리뷰 비율 살펴보기 매출 10% 미만 중 리뷰가 있는 Data 가장 최근을 기준으로 잘하고 있는 호스트가 가장 중요하다. score 만들기: 100점 만점으로 어디 있는지 직관적으로 볼 수 있는 것이 좋다. 이중축 사용시 하단에 텍스트로 부가설명이 필요하다. 1.2 우리 조 피드백 매크로 의심 boxplot 수정: room 수가 많다고 매크로 X, 방은 많지만 리뷰가 없거나 리뷰가 있어도 최악인 방을 추가해 주기 고객에게 보여주기 무리인 대시보드이다...

📖 오늘 내가 배운 것 1. 과제 피드백 2. 매개변수 3, 필터 4. 동작 5. 사용 빈도 잦은 차트 6. 팀 과제 7. 개인 과제 1. 과제 피드백 1.1 전체적인 과제 피드백 📌 1. 임원/의결자 분들 보고 대시보드 임원/의결자 분들은 큰 그림을 보고 싶어 함! Region Manager는 내가 얼마나 하고 있나? 세부적으로 체크하고 싶어함. 하나 팔고 하나 체크 숫자 너무 작다 시트 및 그래프에 - 숫자 무조건 나와 있어야 한다! 그리고 단위에 예민하다 카테고리 매출 TOP 5? : 삼성 전자 예시를 들면, 핸드폰이 매 달 1위 아닌가? → 꼭 그런 건 아닐 수 있다~ EX) 쿠팡 소고기 지역 별 TOP 5? : 의미 없을 수 있다! → 변동이 많이 있는 필드에서만 사용해야 함. MOM 22년도만..

📖 오늘 내가 배운 것 1. 태블로는? 2. 바람직한 대시보드 3. 데이터 초기 정제 4. 대시보드 틀 잡기 5. 시트 다루기 기초 6. 간단 프로젝트 1. 태블로는? 🍠 태블로? → 태블로는 시각적 분석 플랫폼 🍠 시각화 목적? → 조직원, 의결자분들께 보여주려고 시각화! 🍠 태블로 데스크탑 프로 vs 퍼블릭 → 가장 큰 차이는 보안! → 퍼블릭 사용하면 회사 데이터 전 세계에 뿌리는 꼴 → 절대 데스크탑 프로와 퍼블릭 연결하면 안 됨 2. 바람직한 대시보드 꾸밀 줄 모르면 KPI 대시보드 퍼블릭에서 따라 하기~ 태블로 퍼블릭에서 다른 사람 거 다운 받아서 계산된 필드 똑같이 재현할 수 있는 수준이어야 함 → 계산된 필드 읽고 트랙킹 🍠 최대한 한눈에 볼 수 있게 만들어야 한다면? 매개변수, 필터 활용..

📖 오늘 내가 배운 것 중간 평가 대비해서 Python, SQL 헷갈리는 개념들 총 정리! 1.1 데이터와 정보 구분 내용 예시 데이터 객관적 사실을 수집하여 모아놓은 자료 블로그 방문기록 정보 데이터 가공하여 의미 도출된 것 일일 방문자 수, 성별 방문자 수, 시간대별 방문자 수 지식 정보에 개인적 경험을 결합시킨 새로운 지식 방문자가 많은 성별/나이에 대한 원인 파악 지혜 지식에 아이디어가 결합된 창의적 산물 방문자가 많은 성별/나이를 타겟으로 운영 전략 수립 1. Python 1 람다 표현식 - 매개변수와 수식으로 이루어진 함수! lambda 매개변수1, 매개변수2, .... : 수식 2.1 subset 생성할 때 데이터 찾는, 뽑는 방법들 정규식! 라이브러리 불러오기 import re 메타문자 [..