Skip to Content

Data Analytics Cookbook

BigQuery & Pandas로 배우는 실전 데이터 분석

SQL과 Python, 두 가지 접근법으로 동일한 문제를 해결하는 방법을 배워보세요🚀 5분 만에 시작하기

이런 대시보드를 만들 수 있어요!

📊 E-Commerce Analytics Dashboard

이 커리큘럼을 완료하면 매출 분석, 고객 세그멘테이션, 마케팅 성과, 이탈 예측까지 종합적인 비즈니스 인텔리전스 대시보드를 만들 수 있습니다.

📊 KPI Cards🗺️ World Map👥 RFM 분석📈 코호트 리텐션🚨 이탈 예측🧪 A/B 테스트📉 가설검정📐 회귀분석

🎯 라이브 데모 보기

💰 Finance Analytics Dashboard

금융 데이터 분석의 핵심! 주가 예측, 포트폴리오 최적화, 리스크 분석까지 금융권 실무에서 사용하는 분석 기법을 배워보세요.

📈 주가 분석💼 포트폴리오⚠️ 리스크 분석📅 시계열 예측

💰 Finance 데모 보기

💎 프리미엄 스타터킷

전체 실행 가능한 Jupyter Notebook과 연습문제 해설, 실무 유틸리티 함수가 포함되어 있습니다. 메모리 최적화, Copy-on-Write, 대용량 데이터 처리 등 심화 내용을 배워보세요.

📓 Jupyter Notebooks✅ 연습문제 해설🔧 실무 유틸리티📊 면접 85문제

💎 면접 문제집 보기

학습 트랙 선택

🗄️ SQL 트랙

BigQuery를 활용한 SQL 기반 데이터 분석. 대용량 데이터 처리와 클라우드 환경에서의 분석에 적합합니다.
  • BigQuery 콘솔에서 바로 실행
  • 서버리스로 대용량 처리
  • 표준 SQL 문법 사용
SQL 트랙 시작하기 →

🐼 Pandas 트랙

Python Pandas를 활용한 로컬 데이터 분석. 유연한 데이터 조작과 분석 파이프라인 구축에 적합합니다.
  • CSV 파일로 바로 시작
  • 풍부한 Python 생태계 활용
  • 유연한 데이터 변환
Pandas 트랙 시작하기 →

공통 섹션

📊 시각화

Matplotlib, Seaborn, Plotly를 활용한 데이터 시각화바로가기 →

📈 통계분석

가설검정, 회귀분석, A/B 테스트바로가기 →

🤖 머신러닝

클러스터링, 예측 모델, 시계열 분석바로가기 →

사용 데이터

이 Cookbook은 Google BigQuery의 thelook_ecommerce 공개 데이터셋을 기반으로 합니다.

테이블설명주요 컬럼
src_orders주문 정보order_id, user_id, created_at, status
src_order_items주문 상품order_id, product_id, sale_price
src_products상품 정보product_id, category, brand, retail_price
src_users고객 정보user_id, age, gender, country
src_events웹 이벤트session_id, user_id, created_at
events_augmented세션 데이터 (증강)channel_key, device_key, landing_page
cs_tickets_dummyCS 티켓ticket_id, issue_type, satisfaction_score
mkt_campaigns_dummy마케팅 캠페인campaign_id, channel_key, budget

빠른 시작

🚀 5분 안에 시작하기

  1. BigQuery 환경 설정 또는 로컬 환경 설정
  2. 원하는 트랙 선택 (SQL 또는 Pandas)
  3. 첫 번째 레시피 따라하기

난이도 가이드

레벨설명
초급기본 문법, 간단한 집계
중급조인, 서브쿼리, 윈도우 함수
고급복잡한 분석, 최적화, ML 연동
Last updated on

🤖AI 모의면접실전처럼 연습하기