목록STARTERS 4기 🚉/TIL 👶🏻 (52)
ilovechoonsik

📖 오늘 내가 배운 것 1. DateTime 2. 시계열 데이터 Resampling 3. 판다스 시간 이동 4. Rolling and Expanded 5. 시계열 데이터 시각화 6. 연습 문제 1. DateTime 파이썬에서 사용되는 시계열 데이터 타입 종류는 다음과 같다 1.1 Python Datetime from datetime import datetime my_year = 2017 my_month = 1 my_day = 2 my_hour = 13 my_minute = 30 my_second = 15 my_date = datetime(my_year,my_month,my_day) # January 2nd, 2017 my_date # datetime.datetime(2017, 1, 2, 0, 0) my_..

📖 오늘 내가 배운 것 1. Numpy 2. Pandas 3. 결측치 다루기 4. Groupby 5. 일반연산 6. 데이터 입출력 7. 시각화 1. Numpy 1.1 Numpy란? NumPy는 파이썬을 위한 강력한 선형 대수 라이브러리! (배열로 저장된 대용량 데이터 처리에 용이) 📌 배워야 하는 이유? 1. PyData 생태계의 거의 모든 라이브러리 (Pandas, Scippy, Scikit-learn 등)가 NumPy를 주요 구성 요소 중 하나로 사용! 2. 분석 예제를 위한 데이터를 생성하는 데 사용 📌 강력한 점 NumPy는 또한 C 라이브러리와 바인딩을 가지고 있기 때문에 속도가 빠름 1.2 Numpy 배열 (1) 기존 값 넘파이 배열로 만들기 np.array(list) (2) 넘파이 배열 직접..

📖 오늘 내가 배운 것 1. box plot 2. box plot 근거가 될 새로운 데이터 분석 - 산업/주에 따른 소비량 3. box plot 근거가 될 새로운 데이터 분석 - 인구 통계 4. 태블로에서의 예측 5. 스토리 라인 6. 태블로 애니메이션 7. LOD 8.다각형 사용해서 문제 해결 9. 모양 넣기 1. box plot 1.1 분석 프로젝트 개요 📌 의류 소매 업계 데이터 분석가 당신은 의류 소매 업계에서 운영되는 호주 소매 체인에서 일하는 데이터 분석가이며 회사는 호주의 한 주인 뉴사우스웨일즈에서만 운영되고 있습니다 이사회는 퀸즐랜드, 빅토리아 밎 서호주 이 세 개 주 중 하나로 확장을 고려하고 있습니다 당신은 이 세 주 각각에서 해당 산업의 비즈니스 환경을 평가하고, 그 결과를 이사회에 ..

📖 오늘 내가 배운 것 1. 폴더, 그룹 및 집합 2. 테이블 고급 계산 3. 스토리 라인 1. 폴더, 그룹 및 집합 1.1 분석 프로젝트 개요 📌 벤처 캐피털 펀드 : 투자를 위해 잠재적으로 성장할 만한 1000개의 스타트업 검토 📌 투자 기준 (2015) 1. High Revenue 2. Low Expenses 3. Top Growth 📌 주어진 데이터 Sheet 1 : 조사할 회사 리스트 Sheet 2 : 조사할 회사들 재정 관련 정 📌 가정 기업 조사 시 해당 기업이 속한 산업군에 따라 고려해야 할 요소가 많은데, 이 프로젝트에서는 고려하지 않는다! -> 성장 지표만 보고 판단! 1.2 폴더 생성 및 그룹화 (1) 폴더 생성 사용할 데이터에 측정값 데이터가 많다! 실무에서는 많을 경우 100개 이..

📖 오늘 내가 배운 것 1. 테이블 계산, 대시보드, 스토리텔링 2. 데이트 클리닝, 데이터 준비 3. 클러스터, 사용자 지정 영역, 디자인 기능 4. 태블로 새로운 기능 - PDF 1. 테이블 계산, 대시보드, 스토리텔링 1.1 테이블 계산 (1) Number of Records 이번에 사용할 데이터는 영국의 은행 고객 데이터이다! 데이터를 보면 Region으로 위치를 표현하고 있는 걸 확인할 수 있다. 요 데이터를 그대로 태블로에 던지면 태블로는 지도를 생성하지 못한다! 왜 그럴까? Region이라는 데이터는 영국에서 사용하는 위치 데이터인데, 이걸 태블로가 위치 처리를 할 때 "주"로 인식시켜줘야 하기 때문이다~ [Region 우클릭] - [지리적 역할] - [주/시/도] 설정을 하면 사진의 1번과..

📖 오늘 내가 배운 것 1. 태블로 인터페이스 및 막대 차트 그리기 2. 시계열 데이터 활용, 어그리게이션 및 필터 3. 지도, 산점도, 대시보드 4. 조인 및 블렌딩 5. 관계 작업 6. 요약 1. 태블로 사용법 및 막대 차트 그리기! 1.1 데이터 다운로드 후 import 좌 : csv 파일은 comma로 구분된 텍스트로 되어 있기 때문에 사실상 텍스트 파일 우 : 좌측 파일 부분은 이전에 선택한 확장자 파일이 들어있는 폴더! 같은 확장자 파일이 전부 표시되고 여러 개 가져와서 join도 할 수 있음! 좌측 하단의 데이터 원복-시트 옮겨 다니며 작업할 수 있고 새로운 데이터를 불러오고 싶다면 좌측 상단 데이터 - 데이터 불러오기 선택하면 됨 작업공간인 시트로 넘어가 좌측 데이터 요소를 보면 차원(di..

📖 오늘 내가 배운 것 1. Design Thinking? 디자인 씽킹은 명확하게 정리되지 않은 사용자의 니즈를 이해하고, 이를 해결할 수 있는 기회를 찾아내기 위해 공감적 태도를 활용하는 일종의 복잡한 문제 해결에 대한 논리추론적 접근법 제품, 서비스부터 비즈니스 모델과 프로세스에 이르는 다양한 형태의 문제 해결에 적용할 수 있는 사용자 중심의 혁신 프로세스 2. Design Thinking Process 1. 깊이 공감하기! 철저하게 대상의 관점에서 상황을 관찰하고 문제점을 발견하는 과정! 대상 도메인에 대한 이해가 바탕이 되어야 함 2. 문제 정의하기 공감 단계에서 수집한 정보를 정리, 더욱 자세히 들여다보고 핵심 문제를 정의하는 과정! 인간 중심적인 방식으로 이루어져야 함 3. 다양한 아이디어 정..

📖 오늘 내가 배운 것 1. Design Thinking? 디자인 씽킹은 명확하게 정리되지 않은 사용자의 니즈를 이해하고, 이를 해결할 수 있는 기회를 찾아내기 위해 공감적 태도를 활용하는 일종의 복잡한 문제 해결에 대한 논리추론적 접근법 제품, 서비스부터 비즈니스 모델과 프로세스에 이르는 다양한 형태의 문제 해결에 적용할 수 있는 사용자 중심의 혁신 프로세스 2. Design Thinking Process 1. 깊이 공감하기! 철저하게 대상의 관점에서 상황을 관찰하고 문제점을 발견하는 과정! 대상 도메인에 대한 이해가 바탕이 되어야 함 2. 문제 정의하기 공감 단계에서 수집한 정보를 정리, 더욱 자세히 들여다보고 핵심 문제를 정의하는 과정! 인간 중심적인 방식으로 이루어져야 함 3. 다양한 아이디어 정..

📖 오늘 내가 배운 것 Design Thinking? 디자인 씽킹은 명확하게 정리되지 않은 사용자의 니즈를 이해하고, 이를 해결할 수 있는 기회를 찾아내기 위해 공감적 태도를 활용하는 일종의 복잡한 문제 해결에 대한 논리추론적 접근법 제품, 서비스부터 비즈니스 모델과 프로세스에 이르는 다양한 형태의 문제 해결에 적용할 수 있는 사용자 중심의 혁신 프로세스 Design Thinking Process 1. 깊이 공감하기! 철저하게 대상의 관점에서 상황을 관찰하고 문제점을 발견하는 과정! 대상 도메인에 대한 이해가 바탕이 되어야 함 2. 문제 정의하기 공감 단계에서 수집한 정보를 정리, 더욱 자세히 들여다보고 핵심 문제를 정의하는 과정! 인간 중심적인 방식으로 이루어져야 함 3. 다양한 아이디어 정의된 문제를..

ggplot2 패키지 설치 및 기본 문법 ggplot2 사용한 데이터 시각화 ggplot2 사용한 그래프 꾸미기 ggplot2 기반 시각화 실습 영화평 텍스트 국정원 트윗, 발라드 가사 미국 주별 강렬 범죄율 시계열 데이터 예측 통계 분석 기법을 이용한 가설 검정 t 검정 및 통계 분석 유의사항 상관분석 실습 - 와인 성분과 품질 간 관계 구하기 1. ggplot2 1.1 ggplot2 란? 기본 패키지보다 우수한 시각화 기능 제공 gg 문법 구조 바탕, 일관된 규칙에 따라 그래프 생성 -> 요소들의 층으로 이루어진다, data layer 부터 시작하여 각 층의 요소들을 더해 시각화 완성하는 방 1.2 두 가지 함수 (1) qplot : 빠르게 시각화 할 때 사용, 기본 함수 plot과 유사한 사용법 q..