본문 바로가기

IT27

SQL with 빅쿼리 - Amazon 데이터셋 기반 추천 시스템 설계 🚀 Amazon 데이터셋 기반 추천 시스템 설계 프로젝트📌 프로젝트 개요이번 프로젝트는 Amazon 데이터셋을 기반으로 고객 맞춤형 추천 시스템을 설계하고 구현하는 작업입니다. Amazon은 전 세계적으로 가장 큰 전자상거래 플랫폼 중 하나로, 방대한 고객 리뷰와 제품 데이터를 보유하고 있습니다.이번 프로젝트에서는 이러한 데이터를 SQL만을 사용하여 분석하고, 고객의 구매 경험을 향상시킬 수 있는 추천 시스템의 기초를 설계하는 것이 목표입니다.🎯 학습 목표데이터 이해 및 탐색먼저 Amazon 데이터셋을 분석하여 고객과 제품 간의 상호작용 데이터를 이해합니다. 고객 리뷰, 평점, 제품 카테고리 등 다양한 데이터를 활용해 주요 인사이트를 도출합니다.추천 시스템 설계 및 구현SQL을 사용해 인기 제품 추.. 2026. 4. 26.
SQL with 빅쿼리 - 유저 행동 변화 분석 및 오프라인 매장 분석 1. A/B Testing Data - 신규 기능 출시 전후의 유저 행동 변화 분석📌 학습 목적이 실습의 목표는 A/B 테스트 데이터를 활용하여 신규 기능이 사용자 행동에 미친 영향을 분석하는 것입니다. 전환율(Conversion Rate) 비교를 통해 그룹 간 성과 차이를 정량적으로 평가하며, 궁극적으로 신규 기능이 실제 비즈니스 성과에 긍정적 영향을 주었는지를 판단하는 데이터 기반 의사결정 역량을 강화하는 것을 목표로 합니다.📌 주요 개념이 데이터는 신규 기능(웹페이지)의 효과를 측정하기 위해 실시한 A/B 테스트 결과를 담고 있습니다. 사용자는 무작위로 기존 페이지(old_page) 또는 신규 페이지(new_page) 중 하나에 배정되었으며, 그 결과 전환(가입, 구매 등)이 발생했는지를 con.. 2026. 4. 25.
SQL with 빅쿼리 - 마케팅 캠페인 성과분석 1. Customer Churn Dataset - 유저 리텐션 분석 및 이탈 예측고객 이탈(Customer Churn)이란 고객이 기업이나 서비스 제공자와의 관계 또는 구독을 중단하는 현상을 의미합니다. 이는 일정 기간 동안 고객이 제품이나 서비스를 더 이상 이용하지 않게 되는 비율을 나타내며, 기업의 매출, 성장, 고객 유지율에 직접적인 영향을 미치는 중요한 지표입니다.Churn 데이터셋에서는 'Churn'이라는 라벨이 해당 고객이 이탈했는지를 나타냅니다. 이탈한 고객은 더 이상 서비스를 이용하지 않기로 결정한 사람을 의미하며, 반대로 비이탈 고객은 여전히 서비스를 이용하며 기업과의 관계를 유지하고 있는 사람입니다.📌 학습 목적이 실습의 목적은 고객 이탈(Churn)과 리텐션(Retention)에 영.. 2026. 4. 24.
SQL with 빅쿼리 - 이커머스 전환율 분석 및 상품 추천 전략 수립 1. Online Retail Dataset - 이커머스 취소/반품율 개선 분석이 데이터셋은 실제 영국 기반의 온라인 소매업체의 거래 기록을 담고 있으며, 2010년 12월 1일부터 2011년 12월 9일까지의 데이터를 포함하고 있습니다. 이 데이터셋은 고객 행동 분석, 구매 패턴 탐색, 전환율 분석 등 다양한 이커머스 분석 실습에 활용됩니다.📌 학습 목적결제 완료 단계와 취소/반품 단계를 구분하여 이커머스 전환율을 분석하고, 고객 행동 데이터로부터 전략 수립에 필요한 인사이트를 도출하는 능력을 기릅니다.기간: 2010년 12월 1일 ~ 2011년 12월 9일총 거래 수: 541,909건결측치: 없음(No)컬럼명설명InvoiceNo주문 번호. 각 거래에 고유하게 할당된 6자리 숫자. 'C'로 시작하면 .. 2026. 4. 23.
SQL with 빅쿼리 - PV, UV, ARPU, ARPPU, AARRR, 리텐션 분석 SQL심화 - SQL로 데이터 분석하기PV, UV란?1️⃣ PV (Page View)페이지가 열릴 때마다 1번씩 카운트되는 값같은 사람이 여러 번 봐도 모두 PV로 계산새로고침도 PV 증가페이지 이동도 PV 증가총 페이지 조회 수허수가 많기 때문에 주의가 필요함SELECT page_url, COUNT(user_id) AS PVFROM `modulabs.visits`GROUP BY page_url2️⃣ Unique PV한 사람이 같은 페이지를 여러 번 봐도 1번만 카운트페이지 기준 중복 뷰를 제거한 조회수특정 페이지의 중복 제거 조회SELECT page_url, COUNT(DISTINCT user_id) AS UniquePVFROM `modulabs.visits`GROUP BY page_url3️⃣ Vis.. 2026. 4. 23.
SQL with 빅쿼리 - WITH문, WHERE문, 순위함수, 집계함수, 그룹함수 1. SQL 심화WITH문복잡한 쿼리를 단계별로 만들 수 있음가독성이 좋음같은 결과를 여러 번 사용 가능함디버깅하기 좋음WITH 임시 테이블 명 AS ( WITH 문으로 저장하고 싶은 SQL 쿼리문)SELECT * FROM 임시 테이블 명WITH문 언제 쓰는가?JOIN이 많을 때GROUP BY 여러 단계일 때데이터 전처리 단계가 있을 때쿼리가 길어질 때WHERE 1=1WHERE 1=1 은 SQL에서 조건을 쉽게 붙이기 위한 관용적인 패턴사실 논리적으로 아무 의미가 없음 (항상 참)단순 쿼리에서는 굳이 필요 없음SELECT *FROM tableWHERE 1=1# 위에 쿼리문이랑 완전히 같음SELECT *FROM tableWHERE 1=1 그럼 왜 쓰느냐?조건을 쉽게 추가하려고 쓰는 SQL 습관조건을 AN.. 2026. 4. 23.