2024/10 58

HackerRank 코딩 테스트 - Weather Observation Station 20(LV.Medium)

A median is defined as a number separating the higher half of a data set from the lower half. Query the median of the Northern Latitudes (LAT_N) from STATION and round your answer to 4 decimal places. Input FormatThe STATION table is described as follows:where LAT_N is the northern latitude and LONG_W is the western longitude. 중앙값(Median)은 데이터 집합의 상위 절반과 하위 절반을 나누는 값으로 정의됩니다. STATION 테이블에서 북위(LA..

[SQL] 2024.10.25

HackerRank 코딩 테스트 - The Report(LV.Medium)

Ketty gives Eve a task to generate a report containing three columns: Name, Grade and Mark. Ketty doesn't want the NAMES of those students who received a grade lower than 8. The report must be in descending order by grade -- i.e. higher grades are entered first. If there is more than one student with the same grade (8-10) assigned to them, order those particular students by their name alphabetic..

[SQL] 2024.10.24

회귀분석 (2)

1. E(Yi)의 추정 및 검정 E( Y | X )     - ŷi의 분포 - 오차분산을 모를 때, - E( Yi )의 100(1 - α)% 신뢰구간  - 검정통계량 - 양측검정H0 : E(Yi) = μ0,  H1 : E(Yi) ≠ μ0 - 귀무가설 기각 : E(Yi)이 μ0가 아니다.  2. 변동 분해- 총 변동 = 설명이 안되는 변동 + 설명이 되는 변동 - 총 제곱합(SST) = 잔차제곱합(SSE) + 회귀제곱합(SSR) 3. 분산분석- 자유도총 변동(n - 1) = 잔차변동(n - 2) + 회귀변동(1) - 평균제곱개인첨언 : 회귀모형의 자유도 p는 설명변수의 수  4. 회귀모형 검정 (F 검정)- F 분포 - F 분포와 t-분포 F-분포와 t-분포의 관계Z ~ N(0, 1),  V ~ χ²(k)..

[통계학] 2024.10.24

회귀분석 (1)

(part 1)회귀 분석1. 회귀분석이란- 독립변수와 종속변수 간 관련성을 설명하는 통계적 모형인 회귀모형을 통해, 두 변수의 데이터로 회귀모형에 적합한 추정회귀식을 계산하고 통계적 분석(추론)을 하는 기법 회귀모형의 계수인 "모수"를 추정 모수에 대한 구간추정/가설검정 등의 분석종속변수 설명에 있어서 독립변수의 상대적 중요성 평가 가능- 예) 기업의 시가총액과 투자활동 - 주식 수익률의 관련성 연구- 과거의 데이터에 의존 (데이터 수집이 중요)- 과거/현재/미래 예측 2. 회귀분석 종류- 단순선형회귀분석- 다중선형회귀분석- 로지스틱회귀분석- 비선형회귀분석  2-1. 회귀분석 종류- 단순선형회귀모형 - 다중선형회귀모형 - 비선형회귀모형 - 다변량회귀모형  단순회귀1. 단순회귀모형- 단순선형회귀모형 - 추..

[통계학] 2024.10.24

HackerRank 코딩 테스트 - Top Competitors(LV.Medium)

Julia just finished conducting a coding contest, and she needs your help assembling the leaderboard! Write a query to print the respective hacker_id and name of hackers who achieved full scores for more than one challenge. Order your output in descending order by the total number of challenges in which the hacker earned a full score. If more than one hacker received full scores in same number of..

[SQL] 2024.10.23

분산 분석 - 일원배치 / 이원배치

분산 분석1. 분산분석(Analysis of Variance)- 독립변수의 수준(범주)으로 나뉜 집단 간 평균 차이를 검정- 특정값의 산포를 인자별로 분해하여 어느 인자가 큰 영향을 주는지- 반응변수처리(treatment)에 의해 변화하는, 연구대상이 되는 변수- 인자(= 요인, factor)반응변수에 영향을 주는 변수독립변수, 설명변수- 처리(treatment)요인의 특정 값(특정 실험 조건)수준(level)2. 기본 가정- 각 집단의 모집단 분포는 정규분포- 각 집단의 모집단의 분산 같음- 각 모집단 내의 오차와 모집단 간 오차는 독립  3. 분산분석(Analysis of Variance) 분해- 전체 변동 = 그룹 간 변동 + 그룹 내 변동그룹 간 변동 = 요인에 의한 효과그룹 내 변동 = 오차에 ..

[통계학] 2024.10.23

두 모집단 비교 - 두 모집단 비교 / 두 모평균 비교 / 대응비교 / 두 모비율 비교 / 두 모분산 비교

두 모집단 비교1. 두 집단의 비교- 모평균 비교, 모비율 비교, 모분산 비교 등- 두 집단의 비교에는 분산이 고려되어야 함분산이 고려되어야 보다 객관적인 비교가 가능 2. 두 모평균의 비교- 두 모평균 비교모분산 Known & 정규모집단모분산 Unknown & 정규모집단 => 모분산 같음 or 모분산 다름- 짝을 이룬 표본 비교  두 모집단 비교 - 모평균1. 두 모평균 차이 추론 : 모분산 knownX1, ... , Xn과 Y1, ... ,Yn이 각각 N( μ1, σ1² ), N( μ2, σ2² )을 따르고 서로 독립- 우리의 관심 대상은 두 모평균의 차이(= μ1 - μ2 )- 추정량 : x̄ - y̅- 검정통계량  2. 두 모평균 차이 추론 : 소표본, 모분산 unknown, 등분산X1, ... ..

[통계학] 2024.10.22

검정 - 검정의 요소 알아보기 / 검정력 함수 / 검정 절차 / 모평균검정 / 모비율검정 / 모분산검정

검정1. 통계적 추론신뢰구간 : 미지의 모수 추정이 목적가설검정 : 모수에 관한 가설의 타당성에 대한 경험적 증거 제시가 목적2. 가설검정모수에 관한 귀무/대립가설을 설정한 후 데이터에 따라 어떤 가설이 맞는지 결정하는 통계적 분석비수도권의 출생률이 수도권 출생률보다 낮다X팀은 홈구장에서의 승률이 원정 구장에서의 승률보다 높다    3. 가설의 종류귀무가설(H0)검정하는 가설대립가설과 상반되는 가설로, 일반적인 사실을 귀무가설로 설정효과가 없다, 차이가 없다 등의 내용대립가설(H1)입증하고자 하는 가설효과가 있다, 차이가 있다 등의 내용4. 가설의 예시예) X팀의 홈구장 승률은 60%보다 높은가?귀무가설 : X팀의 홈구장 평균 승률은 60%보다 작거나 같다. ( µ ≤ 0.60)대립가설 : X팀의 홈구장..

[통계학] 2024.10.22

HackerRank 코딩 테스트 - Challenges(LV.Medium)

Julia asked her students to create some coding challenges. Write a query to print the hacker_id, name, and the total number of challenges created by each student. Sort your results by the total number of challenges in descending order. If more than one student created the same number of challenges, then sort the result by hacker_id. If more than one student created the same number of challenges ..

[SQL] 2024.10.21