https://crimson-slicer-378.notion.site/5-Resampling-Methods-97d80098f44b40768f77a30498726933 5.Resampling Methods Resampling은 통계학에서 중요한 요소 중 하나이다. 이는 Training Data에서 반복적인 sampling을 통해 모델에 적합해보는 것을 의미한다. crimson-slicer-378.notion.site
Statistical Learning
https://crimson-slicer-378.notion.site/4-Classification-3e21ef1cac944fb9b888806fcb1532df 4.Classification An Overview of Classification crimson-slicer-378.notion.site
3. Linear Regression 본 장에서는 지도 학습을 위한 간단한 접근 방식인 선형 회귀에 대한 방식을 설명한다. 통계 컨설턴트로써 데이터를 기반하여 계획을 제안할 때 선형 회귀를 사용하면 답할 수 있는 질문이다. 1. 광고예산과 매출은 관계가 있나요? 우리의 첫 번째 목표는 데이터가 광고 지출과 판매 사이의 연관성에 대한 증거를 제공하는지 여부를 결정하는 것입니다. 증거가 약하면 광고에 돈을 쓰지 않아야 한다고 주장할 수 있습니다. 2. 광고예산과 매출의 관계는 어느 정도인가? 광고와 판매 사이에 관계가 있다고 가정하고 그 관계의 강도를 알고 싶습니다. 광고 예산에 대한 지식은 제품 판매에 대한 많은 정보를 제공합니까? 3. 판매와 관련된 미디어는 무엇입니까? TV, 라디오, 신문의 세 가지 ..
해당 글은 ISLR 2nd Edition 영문판을 학습하고 번역한 글 입니다. 따라서, 일부 오역이 있을수도 있습니다. 2.1 What is Statistical Learning? 그림은 통계 학습을 설명하기 위해 광고 단가 대비 매출을 나타낸다. 또한, 매출을 예측하기 위해 선형 회귀를 통해 각각의 그래프를 fit을 진행한다. 각각의 그래프의 파랑 추세선을 보았을 때 TV가 가장 좋은 효율을 보여준다. 출력 변수를 Y, 입력 변수를 X로 가정하였을 때 X는 광고 단가, Y는 매출이다. 일반적인 식으로 표현 하자면 아래와 같이 표현된다. $$Y = f(x)+ϵ$$ 식에서 $f$는 X와 Y의 관계를 규정 짓는 함수이며, $ϵ$는 x와는 관계 없는 추가적인 noise이며, 평균은 0이다. 본질적으로 통계적 ..