목록전체 글 (255)
ilovechoonsik

1. 이번 주에 어떤 것을 배웠나요? 겪은 시행착오/어려운 점은? 1.1 해커톤 금주는 마지막 주, 해커톤이 있었던 주였고 눈을 감았다 뜨니 어느새 발표장에 앉아 있던 나를 발견할 수 있었을 만큼 시간이 정말 빠르게 지나갔다.. 시간이 짧았기에 잠도 거의 자지 못하고 최선을 다한 우리 팀원 분들과 다른 조 분들께 정말 고생 많으셨다는 말 전해드리고 싶다 (1) 주제 선정 초기 주제 선정에 어려움이 있었다! 매번 프로젝트 진행 시에 메인으로 잡았던 매출 데이터가 없었기 때문에 더 힘들었던 거 같다. 뻔하지 않으면서 실무 관점에서 도움이 될만한 주제를 생각하는데 힘을 많이 쏟았고, 여차저차 합리적인 주제를 도출할 수 있었다. 앞으로 데이터 분석을 지속한다면 무조건 겪을 상황이었기에 이런 관점에서 문제 정의,..

1. 이번 주에 어떤 것을 배웠나요? 겪은 시행착오/어려운 점은? 1.1 SQL 미니 프로젝트 📌 분석 프로세스 더보기 📌 우리는? : Olist에 입점하려는 셀러 📌 분석 목적 : Olist 상위 고객들 특성 파악 후 이에 맞춰 성공적인 입점/셀링 전략 수립 📌 분석 흐름 1. 어떤 고객을 대상으로 해야 할까? RFM 기준 최근 활성화 여부, 구매 횟수, 총 구매액 3가지 지표를 통해 고 2. 어떤 품목을 판매해야 할까? 매출 TOP 10 카테고리 꾸준히 판매되고 있는 카테고리 = 카테고리별 재구매율 3. 어떤 지역에서 판매해야 할까? 주문자와 판매자가 거리, 배송기간, 주문건수 상관관계 2번 품목이 주로 판매되는 지역 TOP 3 📌 피드백 더보기 📌 우리 조 - 셀러 입장에서의 고객 분석이라 한다면?..

📖 오늘 내가 배운 것 1. 발표 및 피드백 2. 최종평가대비 1. 발표 및 피드백 1.1 발표 📌 분석 프로세스 📌 우리는? : Olist에 입점하려는 셀러 📌 분석 목적 : Olist 상위 고객들 특성 파악 후 이에 맞춰 성공적인 입점/셀링 전략 수립 📌 분석 흐름 1. 어떤 고객을 대상으로 해야 할까? RFM 기준 최근 활성화 여부, 구매 횟수, 총 구매액 3가지 지표를 통해 고 2. 어떤 품목을 판매해야 할까? 매출 TOP 10 카테고리 꾸준히 판매되고 있는 카테고리 = 카테고리별 재구매율 3. 어떤 지역에서 판매해야 할까? 주문자와 판매자가 거리, 배송기간, 주문건수 상관관계 2번 품목이 주로 판매되는 지역 TOP 3 📌 피드백 📌 우리 조 - 셀러 입장에서의 고객 분석이라 한다면? RFM 적절..

📖 오늘 내가 배운 것 1. 데이터 임포트 2. 데이터 파악 3. 분석 계획, 목적 4. 지표 설정, 분석 5. 결론 최종 평가와 해커톤 전 마지막 미니 프로젝트 진행 데이터 셋은 kaggle의 Brazilian E-Commerce Public Dataset by Olist 1. 데이터 임포트 1. 데이터 다운 (csv) 2. posgresql에서 olist 스키마 생성 3. posgresql에서 테이블 생성 CREATE TABLE olist.order_items ( order_id varchar, order_item_id varchar (50), product_id varchar (50), seller_id varchar (50), shipping_limit_date timestamp, price fl..

📖 오늘 내가 배운 것 1. RFM 2. 재구매율 분석 3. 이탈고객 분석 4. 함수 5. 과제 1. RFM 분석 고객 세분화 방법에는 DECIL, RFM 등등이 있다! 그 중 RFM 분석~ 1.1 개요 📌 RFM 분석? Decil 분석의 단점을 보완한 분석 기법이 RFM 분석! 1. 구매 가능성이 높은 고객을 식별하기 위한 데이터 분석 방법 2. 마케팅에서 사용자 타겟팅을 위한 방법 📌 지표 및 우선순위 1. Recency : 얼마나 최근에 구매? 2. Frequency : 얼마나 빈번하게 구매? 3. Monetary : 얼마나 많은 금액을 지불? 📌 구하는 순서 기준일 : orders 테이블의 order_date 최대값으로 하기 R : 기준일 대비 며칠이 지났는가 (MAX(order_date) - o..

📖 오늘 내가 배운 것 1. 고객 분석 2. 기본 테이블 생성 및 분석 시작 3. 과제 1. 고객 분석 간단 B2C 기업 고객 분석한다고 하면? 성별, 연령, 사는 지역 등의 속성이 있을 수 있다! 우리 데이터에서는 소속 지역/도시 정도..? 국가별 1.1 국가 별 고객 수, 누적합계 select * , sum(고객수) over (order by 고객수 desc, country asc) from ( select country , count(*) as 고객수 from customers c group by 1 order by 2 desc ) tmp 주의할 점은 고객수 동일 순위에 대한 문제를 해결하기 위해 order by에 고객수-country 정렬 함께 넣어줘야 한다는 거!!! 1.2 국가 별 고객 수, ..

1. 이번 주에 어떤 것을 배웠나요? 겪은 시행착오/어려운 점은? 1.1 ERD 전처리 - 시각화 등 본격적으로 분석에 들어가기 전 필수적으로 수행해야 하는 간단 EDA + ERD를 학습했다! - 방대한 양의 데이터를 분석하기 위해 먼저 데이터를 파악하는 단계이다 테이블 간의 관계와 어떤 컬럼이 존재하고 어떤 의미를 지니는지 등등 ERD를 수행하는 과정에서 자연스럽게 핵심 문제 정의에 가까워질 수 있기에 중요하다고 생각된다 1.2 ERD 연습 및 간단 EDA 과제 1.3 EDA 과제 2 ----과제 -- 월별 매출액 + 주문 건수 + 구매자 수 select to_char( o.order_date, 'YYYY-mm')as month , round(sum(od.unit_price * od.quantity *..

📖 오늘 내가 배운 것 1. Z차트 2. 그룹핑 함수 - group by / grouping sets / roll up / cube 3. 과제 1. Z 차트 - 월별 매출 - 매출누계 : 해당 월 매출에 이전 월까지 매출 누계 (단기적인 추이를 확인할 수 있다) - 이동년계 : 해당 월의 매출에 과거 11개월의 매출을 합한 값 (최근 1년치 누적 합계) - 장기적인, 그래프에 표현되지 않은 11개월 매출의 추이를 확인할 수 있다. A : 안정적, 정체기, 추가성장 위한 액션 필요 B : 매출 증가 추세 C : 매출 감소 추세, 단기 장기 모두 감소세, 성장전환을 위한 액션 필요 -> 상승/하락에 대한 원인을 분석하기 위해 다른 지표 이용한 분석이 필요하다! 📌 그려보자 필요한 컬럼? year / mont..

📖 오늘 내가 배운 것 1. 지난 과제 피드백 2. 제품/카테고리 매출 지표 분석 3. 금일 과제 4. 핵심 내용 정리 1. 지난 과제 피드백 - 말 천천히, 쿼리 결과 테이블 피피티에 넣으면 좋겠다, 결과 부분에 핵심 내용은 볼드나 글씨 진하게 하면 좋겠다! - 근속기간이 높을수록 매출이 높나!? 너무 당연한 사실! -> 기간을 기준으로 두고 구했어야 했다. 2. 제품/카테고리 매출 지표 분석 - 전체 제품 매출 순위, 비율 - 카테고리 별 제품 순위, 비율 📌 사용할 테이블 categories products order order_details suppliers 공급업체 제품 공급하는 업체 📌 주의할 점은? 판매 당시의 uit_price? 단가는 변화 order_details와 products의 un..

📖 오늘 내가 배운 것 1. 임시테이블 2. 윈도우 함수 3. 시계열 분석 4. 윈도우 함수 - 프레임 지정 5. 과제 1. 임시테이블 복잡한 데이터셋 다루는 다양한 방법 개념 장점 단점 ETL 스냅샷 테이블 쿼리 결과를 테이블에 저장 복잡한 로직 없이 테이블에서 원하는 쿼리 실행 실시간 데이터 보기 힘듬 저장 후 데이터 변경 어려움 VIEW 쿼리 결과를 가상 테이블로 생성 - 실시간 성 보장 테이터베이스 쓰기 권한 필요 유지보수 필요 임시테이블 () - 세션동안 유지되는 테이블 - CREATE INSERT로 생성 - 복잡한 로직 없이 테이블에 원하는 쿼리 실행 - 성능 데이터베이스 쓰기 권한 공통테이블 표현식 CTE 쿼리 결과에 이름을 붙여 테이블 처럼 쿼리를 간결하게 작성 가능 (가독성) 여러 CTE..