전체 글 152

표본분포 - 표본분포 / 중심극한정리 / 카이제곱분포 / t분포 / F분포

표본분포1. 표본분포(sampling distribution)모집단에서 일정 크기로 표본을 뽑을 때, 그 표본의 통계량의 확률분포통계적 추정/검정의 핵심 예시) 아래와 같은 분포를 띈 모집단에서 크기가 2인 확률표본 X1과 X2를 추출할 때, 표본평균의 확률분포는?개인첨언 : x̄ = (X1 + X2) / 2가능한 값들을 계산1. X1 = 0, X2 = 0일 때, x̄ = 02. X1 = 0, X2 = 1 또는 X1 = 1, X2 = 0일 때, x̄ = 0.5  3. X1 = 1, X2 = 1일 때, x̄ = 1각 경우의 확률 계산 P( x̄ = 0) = P(X1 = 0, X2 = 0) = 0.3 * 0.3 = 0.09P( x̄ = 0.5) = P(X1 = 0, X2 = 1) + P(X1 = 1, X2 ..

[통계학] 2024.10.21

통계검정 - 가설 / 오류 / 요소 / 절차 / 양측검정 / 단측검정 / 모평균검정

통계검정 : 가설1. 가설 검정설정한 가설이 옳을 때 표본에서의 통계량과 통계량의 분포에서 이론적으로 얻는 특정 값을 비교하여 가설의 기각/채택 여부를 판정하는 방법 확률적 오차 범위를 넘어서면 가설을 기각한다.유의수준(α) : 기각/채택 여부의 판단기준 2. 가설의 종류귀무가설(H0)대립가설과 상반되는 가설로, 일반적인 사실을 귀무가설로 설정효과가 없다, 차이가 없다 등의 내용대립가설(H1)입증하고자 하는 가설효과가 있다, 차이가 있다 등의 내용  오류1. 가설설정의 오류- 제 1종 오류(α)귀무가설을 채택해야 했음에도 이를 기각할 오류표본으로부터 얻은 검정결과가 우연에 의해 귀무가설을 기각하도록 오판된 가능성α는 일반적으로 5%로 설정- 제 2종 오류(β)귀무가설을 기각해야 했음에도 이를 채택할 오류..

[통계학] 2024.10.21

통계적 추정 - 통계적 추정의 정의와 기준 / 점추정 / 구간추정 / 모분산 아는경우 / 모분산 모르는 경우

통계적 추정1. 통계적 추정표본의 통계량을 기초로 하여 모집단의 모수를 추정하는 방법론 2. 통계적 추정의 종류  1) 점추정모수를 단일한 값으로 추측하는 방식신뢰도를 나타낼 수 없음  2) 구간추정모수를 포함한다고 추정되는 구간을 구하는 방식신뢰도를 나타낼 수 있음  기준1. 불편성(Unbiasedness)모수의 추정량의 기댓값이 모수가 되는 성질 2. 유효성(Efficiency)추정량이 불편추정량이고 분산이 다른 추정량에 비해 가장 작은 분산을 갖는 성질 3. 일치성(Consistency)표본 크기가 커질 수록 추정량이 모수에 수렴하는 성질 4. 충분성(Sufficiency)모수에 대해 가능한 많은 표본정보를 내포하는 성질  점추정1. 표준오차(Standard Error)통계량의 표준편차 σ / √n..

[통계학] 2024.10.21

연속확률분포 - Uniform Distribution / 정규분포 / 표본분포 / 중심극한정리 / 카이제곱분포 / t분포 및 F분포

연속확률분포 : Uniform Distribution1. Uniform Distribution연속확률분포 중 가장 간단한 분포 2. 확률밀도함수기댓값 : (a + b) / 2분산 : (b - a)² / 12  정규분포1. 정규분포(가우스분포)연속확률분포 중 가장 널리 사용표본을 통한 통계적 추정 및 가설검정이론의 기본 2. 확률밀도함수  정규분포의 특징1. Bell Shaped : 평균을 중심으로 좌우 대칭의 종모양2. 평균 = 중앙값 = 최빈값3. 평균에 의해 분포의 위치가 결정4. 표준편차에 의해 분포의 모양이 결정 - 표준편차가 크면 평평한 곡선이 됨5. 확률변수 X가 어느 구간에 속할 확률은 그 구간과 분포함수로 이루어진 면적값6. 이항분포와 포아송분포는 일정조건이 만족될 때 정규분포로 근사 가능..

[통계학] 2024.10.20

이산확률분포 - 이항분포 / 포아송분포

이산확률분포 : 이항분포1. 베르누이 시행사상이 두 개뿐인 시행(성공 or 실패)각 시행에서 성공확률과 실패확률의 합은 1각 시행은 서로 독립베르누이 시행을 n번 독립시행 했을 때의 확률변수 x의 분포는 이항분포x01f(x)1 - pp이 때, 확률변수 X의 평균(기댓값) : p확률변수 X의 분산 : p(1 - p)  2. 이항확률분포베르누이 시행을 반복하여 특정한 횟수의 성공/실패가 나타날 확률 3. 이항확률분포의 확률질량함수n : 시행 횟수, x : 성공 횟수, p : 성공 확률기댓값 : np분산 : np(1 - p)  포아송분포1. 포아송분포단위시간, 단위공간 내 발생하는 사건의 횟수를 확률변수 X라고 할 때, X는 λ를 모수로 갖는 포아송분포 따름발생빈도가 낮은 사건의 단위 당 발생 수 2. 포아송..

[통계학] 2024.10.20

확률과 확률변수 - 확률의 정의 / 조건부확률 / 독립과종속 / 베이즈정리 / 확률변수 / 이산확률변수 / 연속확률변수 / 기대값 / 분산과 표준편차 / 공분산과 상관계수

확률과 확률변수 : 확률 정의1. 표본공간(S) : 랜덤한 현상의 모든 가능한 결과의 집합2. 사건(event) : 표본공간의 부분집합합사상 A∪B곱사상 A ∩ B여사상 Ac배반사상 A ∩ B=∅3. Flipping Coin Twice표본공간 S : {HH, HT, TH, TT}사건 A : 동전을 두 번 던지는 시행에서 동전의 앞면이 1번만 A = {HT, TH}  4. 확률의 고전적 정의 : 가능한 결과가 N가지이고, 각 결과가 나타날 가능성이 모두 같을 때, 사건 A에 속하는 결과가 m개라면 A의 확률 5. 경험적 정의(상대도수) 6. 확률의 공리적 정의 : 표본공간 S에서의 임의의 사상 A에 대하여,0 P(S) = 1서로 배반인 사상들에 대하여이 때, P(A)를 사상 A의 확률이라고 함  7. 확률..

[통계학] 2024.10.20

통계량 - 데이터의 종류 / 중심 / 산포 / 형태 / 상관

1. 통계통계는 데이터의 수집, 분석, 추론, 요약 등의 방법론을 다룬다.(The art and science of learning from data)Design(설계/계획)Description(요약) : 데이터를 요약 표현하기 위한 시각적(Graphical), 수치적(numerical) 방법Inference(추론) : 표본에 기반한 모집단에 대한 추론/예측  모집단(Population) : 통계학에서 관심/조사의 대상이 되는 개체의 전체 집합모수(Parameter) : 모집단에 대한 수치적 요약고등학생의 1일 평균 온라인게임 플레이시간강아지보다 고양이를 좋아하는 성인의 비율표본(Sample) : 모집단을 적절히 대표하는 모집단의 일부통계량(Statistic) : 표본에 대한 수치적 요약고등학생 1000..

[통계학] 2024.10.20

HackerRank 코딩 테스트 - Contest Leaderboard(LV.Medium)

You did such a great job helping Julia with her last coding contest challenge that she wants you to work on this one, too!The total score of a hacker is the sum of their maximum scores for all of the challenges. Write a query to print the hacker_id, name, and total score of the hackers ordered by the descending score. If more than one hacker achieved the same total score, then sort the result by..

[SQL] 2024.10.20

HackerRank 코딩 테스트 - Placements(LV.Medium)

You are given three tables: Students, Friends and Packages. Students contains two columns: ID and Name. Friends contains two columns: ID and Friend_ID (ID of the ONLY best friend). Packages contains two columns: ID and Salary (offered salary in $ thousands per month).Write a query to output the names of those students whose best friends got offered a higher salary than them. Names must be ordere..

[SQL] 2024.10.19