목록STARTERS 4기 🚉/TIL 👶🏻 (52)
ilovechoonsik

📖 오늘 내가 배운 것 1. 발표 및 피드백 2. 최종평가대비 1. 발표 및 피드백 1.1 발표 📌 분석 프로세스 📌 우리는? : Olist에 입점하려는 셀러 📌 분석 목적 : Olist 상위 고객들 특성 파악 후 이에 맞춰 성공적인 입점/셀링 전략 수립 📌 분석 흐름 1. 어떤 고객을 대상으로 해야 할까? RFM 기준 최근 활성화 여부, 구매 횟수, 총 구매액 3가지 지표를 통해 고 2. 어떤 품목을 판매해야 할까? 매출 TOP 10 카테고리 꾸준히 판매되고 있는 카테고리 = 카테고리별 재구매율 3. 어떤 지역에서 판매해야 할까? 주문자와 판매자가 거리, 배송기간, 주문건수 상관관계 2번 품목이 주로 판매되는 지역 TOP 3 📌 피드백 📌 우리 조 - 셀러 입장에서의 고객 분석이라 한다면? RFM 적절..

📖 오늘 내가 배운 것 1. 데이터 임포트 2. 데이터 파악 3. 분석 계획, 목적 4. 지표 설정, 분석 5. 결론 최종 평가와 해커톤 전 마지막 미니 프로젝트 진행 데이터 셋은 kaggle의 Brazilian E-Commerce Public Dataset by Olist 1. 데이터 임포트 1. 데이터 다운 (csv) 2. posgresql에서 olist 스키마 생성 3. posgresql에서 테이블 생성 CREATE TABLE olist.order_items ( order_id varchar, order_item_id varchar (50), product_id varchar (50), seller_id varchar (50), shipping_limit_date timestamp, price fl..

📖 오늘 내가 배운 것 1. RFM 2. 재구매율 분석 3. 이탈고객 분석 4. 함수 5. 과제 1. RFM 분석 고객 세분화 방법에는 DECIL, RFM 등등이 있다! 그 중 RFM 분석~ 1.1 개요 📌 RFM 분석? Decil 분석의 단점을 보완한 분석 기법이 RFM 분석! 1. 구매 가능성이 높은 고객을 식별하기 위한 데이터 분석 방법 2. 마케팅에서 사용자 타겟팅을 위한 방법 📌 지표 및 우선순위 1. Recency : 얼마나 최근에 구매? 2. Frequency : 얼마나 빈번하게 구매? 3. Monetary : 얼마나 많은 금액을 지불? 📌 구하는 순서 기준일 : orders 테이블의 order_date 최대값으로 하기 R : 기준일 대비 며칠이 지났는가 (MAX(order_date) - o..

📖 오늘 내가 배운 것 1. 고객 분석 2. 기본 테이블 생성 및 분석 시작 3. 과제 1. 고객 분석 간단 B2C 기업 고객 분석한다고 하면? 성별, 연령, 사는 지역 등의 속성이 있을 수 있다! 우리 데이터에서는 소속 지역/도시 정도..? 국가별 1.1 국가 별 고객 수, 누적합계 select * , sum(고객수) over (order by 고객수 desc, country asc) from ( select country , count(*) as 고객수 from customers c group by 1 order by 2 desc ) tmp 주의할 점은 고객수 동일 순위에 대한 문제를 해결하기 위해 order by에 고객수-country 정렬 함께 넣어줘야 한다는 거!!! 1.2 국가 별 고객 수, ..

📖 오늘 내가 배운 것 1. Z차트 2. 그룹핑 함수 - group by / grouping sets / roll up / cube 3. 과제 1. Z 차트 - 월별 매출 - 매출누계 : 해당 월 매출에 이전 월까지 매출 누계 (단기적인 추이를 확인할 수 있다) - 이동년계 : 해당 월의 매출에 과거 11개월의 매출을 합한 값 (최근 1년치 누적 합계) - 장기적인, 그래프에 표현되지 않은 11개월 매출의 추이를 확인할 수 있다. A : 안정적, 정체기, 추가성장 위한 액션 필요 B : 매출 증가 추세 C : 매출 감소 추세, 단기 장기 모두 감소세, 성장전환을 위한 액션 필요 -> 상승/하락에 대한 원인을 분석하기 위해 다른 지표 이용한 분석이 필요하다! 📌 그려보자 필요한 컬럼? year / mont..

📖 오늘 내가 배운 것 1. 지난 과제 피드백 2. 제품/카테고리 매출 지표 분석 3. 금일 과제 4. 핵심 내용 정리 1. 지난 과제 피드백 - 말 천천히, 쿼리 결과 테이블 피피티에 넣으면 좋겠다, 결과 부분에 핵심 내용은 볼드나 글씨 진하게 하면 좋겠다! - 근속기간이 높을수록 매출이 높나!? 너무 당연한 사실! -> 기간을 기준으로 두고 구했어야 했다. 2. 제품/카테고리 매출 지표 분석 - 전체 제품 매출 순위, 비율 - 카테고리 별 제품 순위, 비율 📌 사용할 테이블 categories products order order_details suppliers 공급업체 제품 공급하는 업체 📌 주의할 점은? 판매 당시의 uit_price? 단가는 변화 order_details와 products의 un..

📖 오늘 내가 배운 것 1. 임시테이블 2. 윈도우 함수 3. 시계열 분석 4. 윈도우 함수 - 프레임 지정 5. 과제 1. 임시테이블 복잡한 데이터셋 다루는 다양한 방법 개념 장점 단점 ETL 스냅샷 테이블 쿼리 결과를 테이블에 저장 복잡한 로직 없이 테이블에서 원하는 쿼리 실행 실시간 데이터 보기 힘듬 저장 후 데이터 변경 어려움 VIEW 쿼리 결과를 가상 테이블로 생성 - 실시간 성 보장 테이터베이스 쓰기 권한 필요 유지보수 필요 임시테이블 () - 세션동안 유지되는 테이블 - CREATE INSERT로 생성 - 복잡한 로직 없이 테이블에 원하는 쿼리 실행 - 성능 데이터베이스 쓰기 권한 공통테이블 표현식 CTE 쿼리 결과에 이름을 붙여 테이블 처럼 쿼리를 간결하게 작성 가능 (가독성) 여러 CTE..

📖 오늘 내가 배운 것 1. 발표 및 피드백 2. 기초 복습 3. 주요 지표 추출 방안 4. 과제 1. 발표 및 피드백 피드백 - 전체 데이터에 대한 인사이트 찾는 것도 좋지만 초기 단계에서는 테이블-컬럼 EDA 했을면 좋을 거 같다! 2. 데이터 분석을 위한 쿼리 기초 복습 2.1 기본 select 구문 DISTINCT : 중복 추출되는행 제거 * : 테이블 내 모든 컬럼 추출 alias : 다른 이름 부여 테이블명 : 칼럼 추출 대상 테이블 WHERE : 검색 조건 앞에 명시하는 키워드 조건 - 컬럼, 표현식, 상수, 비교 연산자, 논리 연산자, 부정 연산자 ORDER BY : 정렬! ASC or DESC 2.2 칼럼 연산자 - 산술 연산자 : 숫자형 자료인 경우 연산 (+,-,*,/) - 합성 연산..

📖 오늘 내가 배운 것 1. 환경 구축 2. 분석 프로세스 3. ERD 및 데이터셋 파악 1. 환경 구축 1. PostgreSQL 링크 Community DL Page Note: EDB no longer provides Linux installers for PostgreSQL 11 and later versions, and users are encouraged to use the platform-native packages. Version 10.x and below will be supported until their end of life. For more information, please see this blog p www.enterprisedb.com 2. pgAdmin 4 pgAdmin 4를 통해..

📖 오늘 내가 배운 것 Tableau Desktop Specialist 공부 2 1. Tableau Desktop Specialist Test 1. True or False: Physical tables remain distinct (normalized), not merged in the data source whereas logical tables are merged into a single, flat table. 답 : False 2. Which of the following are true about dimensions? 답 : They contain qualitative values (such as names, dates, or geographical data) They affect the lev..