[통계학] 13

회귀분석 (2)

1. E(Yi)의 추정 및 검정 E( Y | X )     - ŷi의 분포 - 오차분산을 모를 때, - E( Yi )의 100(1 - α)% 신뢰구간  - 검정통계량 - 양측검정H0 : E(Yi) = μ0,  H1 : E(Yi) ≠ μ0 - 귀무가설 기각 : E(Yi)이 μ0가 아니다.  2. 변동 분해- 총 변동 = 설명이 안되는 변동 + 설명이 되는 변동 - 총 제곱합(SST) = 잔차제곱합(SSE) + 회귀제곱합(SSR) 3. 분산분석- 자유도총 변동(n - 1) = 잔차변동(n - 2) + 회귀변동(1) - 평균제곱개인첨언 : 회귀모형의 자유도 p는 설명변수의 수  4. 회귀모형 검정 (F 검정)- F 분포 - F 분포와 t-분포 F-분포와 t-분포의 관계Z ~ N(0, 1),  V ~ χ²(k)..

[통계학] 2024.10.24

회귀분석 (1)

(part 1)회귀 분석1. 회귀분석이란- 독립변수와 종속변수 간 관련성을 설명하는 통계적 모형인 회귀모형을 통해, 두 변수의 데이터로 회귀모형에 적합한 추정회귀식을 계산하고 통계적 분석(추론)을 하는 기법 회귀모형의 계수인 "모수"를 추정 모수에 대한 구간추정/가설검정 등의 분석종속변수 설명에 있어서 독립변수의 상대적 중요성 평가 가능- 예) 기업의 시가총액과 투자활동 - 주식 수익률의 관련성 연구- 과거의 데이터에 의존 (데이터 수집이 중요)- 과거/현재/미래 예측 2. 회귀분석 종류- 단순선형회귀분석- 다중선형회귀분석- 로지스틱회귀분석- 비선형회귀분석  2-1. 회귀분석 종류- 단순선형회귀모형 - 다중선형회귀모형 - 비선형회귀모형 - 다변량회귀모형  단순회귀1. 단순회귀모형- 단순선형회귀모형 - 추..

[통계학] 2024.10.24

분산 분석 - 일원배치 / 이원배치

분산 분석1. 분산분석(Analysis of Variance)- 독립변수의 수준(범주)으로 나뉜 집단 간 평균 차이를 검정- 특정값의 산포를 인자별로 분해하여 어느 인자가 큰 영향을 주는지- 반응변수처리(treatment)에 의해 변화하는, 연구대상이 되는 변수- 인자(= 요인, factor)반응변수에 영향을 주는 변수독립변수, 설명변수- 처리(treatment)요인의 특정 값(특정 실험 조건)수준(level)2. 기본 가정- 각 집단의 모집단 분포는 정규분포- 각 집단의 모집단의 분산 같음- 각 모집단 내의 오차와 모집단 간 오차는 독립  3. 분산분석(Analysis of Variance) 분해- 전체 변동 = 그룹 간 변동 + 그룹 내 변동그룹 간 변동 = 요인에 의한 효과그룹 내 변동 = 오차에 ..

[통계학] 2024.10.23

두 모집단 비교 - 두 모집단 비교 / 두 모평균 비교 / 대응비교 / 두 모비율 비교 / 두 모분산 비교

두 모집단 비교1. 두 집단의 비교- 모평균 비교, 모비율 비교, 모분산 비교 등- 두 집단의 비교에는 분산이 고려되어야 함분산이 고려되어야 보다 객관적인 비교가 가능 2. 두 모평균의 비교- 두 모평균 비교모분산 Known & 정규모집단모분산 Unknown & 정규모집단 => 모분산 같음 or 모분산 다름- 짝을 이룬 표본 비교  두 모집단 비교 - 모평균1. 두 모평균 차이 추론 : 모분산 knownX1, ... , Xn과 Y1, ... ,Yn이 각각 N( μ1, σ1² ), N( μ2, σ2² )을 따르고 서로 독립- 우리의 관심 대상은 두 모평균의 차이(= μ1 - μ2 )- 추정량 : x̄ - y̅- 검정통계량  2. 두 모평균 차이 추론 : 소표본, 모분산 unknown, 등분산X1, ... ..

[통계학] 2024.10.22

검정 - 검정의 요소 알아보기 / 검정력 함수 / 검정 절차 / 모평균검정 / 모비율검정 / 모분산검정

검정1. 통계적 추론신뢰구간 : 미지의 모수 추정이 목적가설검정 : 모수에 관한 가설의 타당성에 대한 경험적 증거 제시가 목적2. 가설검정모수에 관한 귀무/대립가설을 설정한 후 데이터에 따라 어떤 가설이 맞는지 결정하는 통계적 분석비수도권의 출생률이 수도권 출생률보다 낮다X팀은 홈구장에서의 승률이 원정 구장에서의 승률보다 높다    3. 가설의 종류귀무가설(H0)검정하는 가설대립가설과 상반되는 가설로, 일반적인 사실을 귀무가설로 설정효과가 없다, 차이가 없다 등의 내용대립가설(H1)입증하고자 하는 가설효과가 있다, 차이가 있다 등의 내용4. 가설의 예시예) X팀의 홈구장 승률은 60%보다 높은가?귀무가설 : X팀의 홈구장 평균 승률은 60%보다 작거나 같다. ( µ ≤ 0.60)대립가설 : X팀의 홈구장..

[통계학] 2024.10.22

추정 - 점추정 / 구간추정 / (모평균,모비율,모분산의) 구간추정 / 표본크기결정

추정1. 통계적 추정(estimation)표본의 통계량을 기초로 하여 모집단의 모수를 추정하는 방법론통계적 추정의 관심대상은 통계량이 아니라 모수 2. 통계적 추정의 종류  1) 점 추정(Point estimation)모수를 단일한 값으로 추측하는 방식신뢰도를 나타낼 수 없음(추정치가 어느정도 옳을지 모름)오차에 대한 정보가 없음  2) 구간추정모수를 포함한다고 추정되는 구간을 구하는 방식신뢰도를 나타낼 수 있음  점 추정1. 추정량(estimator)확률변수(표본 추출 전에는 알 수 없음)모수에 대한 대략적 정보 제공 2. 추정값(estimate)표본 추출로 추정량을 통해 실현된 값 3. 통계량과 추정량의 차이추정량 = 추정에 사용되는 통계량추정값 = 표본에서 결정된 추정량의 값  1. 불편성(Unbi..

[통계학] 2024.10.21

표본분포 - 표본분포 / 중심극한정리 / 카이제곱분포 / t분포 / F분포

표본분포1. 표본분포(sampling distribution)모집단에서 일정 크기로 표본을 뽑을 때, 그 표본의 통계량의 확률분포통계적 추정/검정의 핵심 예시) 아래와 같은 분포를 띈 모집단에서 크기가 2인 확률표본 X1과 X2를 추출할 때, 표본평균의 확률분포는?개인첨언 : x̄ = (X1 + X2) / 2가능한 값들을 계산1. X1 = 0, X2 = 0일 때, x̄ = 02. X1 = 0, X2 = 1 또는 X1 = 1, X2 = 0일 때, x̄ = 0.5  3. X1 = 1, X2 = 1일 때, x̄ = 1각 경우의 확률 계산 P( x̄ = 0) = P(X1 = 0, X2 = 0) = 0.3 * 0.3 = 0.09P( x̄ = 0.5) = P(X1 = 0, X2 = 1) + P(X1 = 1, X2 ..

[통계학] 2024.10.21

통계검정 - 가설 / 오류 / 요소 / 절차 / 양측검정 / 단측검정 / 모평균검정

통계검정 : 가설1. 가설 검정설정한 가설이 옳을 때 표본에서의 통계량과 통계량의 분포에서 이론적으로 얻는 특정 값을 비교하여 가설의 기각/채택 여부를 판정하는 방법 확률적 오차 범위를 넘어서면 가설을 기각한다.유의수준(α) : 기각/채택 여부의 판단기준 2. 가설의 종류귀무가설(H0)대립가설과 상반되는 가설로, 일반적인 사실을 귀무가설로 설정효과가 없다, 차이가 없다 등의 내용대립가설(H1)입증하고자 하는 가설효과가 있다, 차이가 있다 등의 내용  오류1. 가설설정의 오류- 제 1종 오류(α)귀무가설을 채택해야 했음에도 이를 기각할 오류표본으로부터 얻은 검정결과가 우연에 의해 귀무가설을 기각하도록 오판된 가능성α는 일반적으로 5%로 설정- 제 2종 오류(β)귀무가설을 기각해야 했음에도 이를 채택할 오류..

[통계학] 2024.10.21

통계적 추정 - 통계적 추정의 정의와 기준 / 점추정 / 구간추정 / 모분산 아는경우 / 모분산 모르는 경우

통계적 추정1. 통계적 추정표본의 통계량을 기초로 하여 모집단의 모수를 추정하는 방법론 2. 통계적 추정의 종류  1) 점추정모수를 단일한 값으로 추측하는 방식신뢰도를 나타낼 수 없음  2) 구간추정모수를 포함한다고 추정되는 구간을 구하는 방식신뢰도를 나타낼 수 있음  기준1. 불편성(Unbiasedness)모수의 추정량의 기댓값이 모수가 되는 성질 2. 유효성(Efficiency)추정량이 불편추정량이고 분산이 다른 추정량에 비해 가장 작은 분산을 갖는 성질 3. 일치성(Consistency)표본 크기가 커질 수록 추정량이 모수에 수렴하는 성질 4. 충분성(Sufficiency)모수에 대해 가능한 많은 표본정보를 내포하는 성질  점추정1. 표준오차(Standard Error)통계량의 표준편차 σ / √n..

[통계학] 2024.10.21

연속확률분포 - Uniform Distribution / 정규분포 / 표본분포 / 중심극한정리 / 카이제곱분포 / t분포 및 F분포

연속확률분포 : Uniform Distribution1. Uniform Distribution연속확률분포 중 가장 간단한 분포 2. 확률밀도함수기댓값 : (a + b) / 2분산 : (b - a)² / 12  정규분포1. 정규분포(가우스분포)연속확률분포 중 가장 널리 사용표본을 통한 통계적 추정 및 가설검정이론의 기본 2. 확률밀도함수  정규분포의 특징1. Bell Shaped : 평균을 중심으로 좌우 대칭의 종모양2. 평균 = 중앙값 = 최빈값3. 평균에 의해 분포의 위치가 결정4. 표준편차에 의해 분포의 모양이 결정 - 표준편차가 크면 평평한 곡선이 됨5. 확률변수 X가 어느 구간에 속할 확률은 그 구간과 분포함수로 이루어진 면적값6. 이항분포와 포아송분포는 일정조건이 만족될 때 정규분포로 근사 가능..

[통계학] 2024.10.20