[데이터자격시험용-필수요약정리] 44

[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (완) - 회귀분석

이번 8회 빅데이터 분석기사 필기/실기 시험은 메타코드 온라인 강의를 수강하여 대비하기로 결정하였다. 메타코드는 데이터사이언스와 인공지능을 비롯한 전반적인 데이터 직무에 대한 교육을 받을 수 있는 교육 사이트이다. 메타코드에서 서포터즈를 뽑는다는 공지를 보고 데이터분석 직무에 대한 공부를 하겠다는 마음가짐과 성실성을 어필하게 되었고, 좋은 기회를 받아 이번 5기 서포터즈에 합류하게 되었다. 메타코드 서포터즈 첫 활동으로, 2024 빅분기 실기 강의에 대한 내용의 일부와 그 후기를 작성하고자 한다.       3. 회귀분석1) 다중선형회귀 (LinearRegression) 독립변수(X)가 종속변수(Y)에 어떻게 영향을 주는지 식으로 표현한 것  *특징 : 식을 보고 설명이 가능함, 가장 적은 수의 X로 Y..

[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (5) - 상관분석

이번 8회 빅데이터 분석기사 필기/실기 시험은 메타코드 온라인 강의를 수강하여 대비하기로 결정하였다. 메타코드는 데이터사이언스와 인공지능을 비롯한 전반적인 데이터 직무에 대한 교육을 받을 수 있는 교육 사이트이다. 메타코드에서 서포터즈를 뽑는다는 공지를 보고 데이터분석 직무에 대한 공부를 하겠다는 마음가짐과 성실성을 어필하게 되었고, 좋은 기회를 받아 이번 5기 서포터즈에 합류하게 되었다. 메타코드 서포터즈 첫 활동으로, 2024 빅분기 실기 강의에 대한 내용의 일부와 그 후기를 작성하고자 한다.       2. 상관분석■ 상관관계 분석  - 정의 : 두 변수간의 선형관계를 분석하는 기법  - 표현방법 : 공분산, 상관계수  1. 공분산 단점 : 두 변수의 단위에 따라 값의 차이가 크다이를 개선하기 위해..

[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (4) - 카이제곱검정

이번 8회 빅데이터 분석기사 필기/실기 시험은 메타코드 온라인 강의를 수강하여 대비하기로 결정하였다. 메타코드는 데이터사이언스와 인공지능을 비롯한 전반적인 데이터 직무에 대한 교육을 받을 수 있는 교육 사이트이다. 메타코드에서 서포터즈를 뽑는다는 공지를 보고 데이터분석 직무에 대한 공부를 하겠다는 마음가짐과 성실성을 어필하게 되었고, 좋은 기회를 받아 이번 5기 서포터즈에 합류하게 되었다. 메타코드 서포터즈 첫 활동으로, 2024 빅분기 실기 강의에 대한 내용의 일부와 그 후기를 작성하고자 한다.       1. 가설검정 - 카이제곱검정  1. 적합성 검정 : 각 범주에 속할 확률이 같은지?chisquare(f_obs=a, f_exp=b)■ 예제로 이해하기 1랜덤박스에 상품 A, B, C, D가 들어있다..

[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (3) - 모평균검정

이번 8회 빅데이터 분석기사 필기/실기 시험은 메타코드 온라인 강의를 수강하여 대비하기로 결정하였다. 메타코드는 데이터사이언스와 인공지능을 비롯한 전반적인 데이터 직무에 대한 교육을 받을 수 있는 교육 사이트이다. 메타코드에서 서포터즈를 뽑는다는 공지를 보고 데이터분석 직무에 대한 공부를 하겠다는 마음가짐과 성실성을 어필하게 되었고, 좋은 기회를 받아 이번 5기 서포터즈에 합류하게 되었다. 메타코드 서포터즈 첫 활동으로, 2024 빅분기 실기 강의에 대한 내용의 일부와 그 후기를 작성하고자 한다.       1. 가설검정 - 모평균 비교(1개)  1. 단일표본 t-teststats.ttest_1samp(a, popmean=기준값, alternative='two-sided'/'greater'/'less')..

[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (2)

이번 8회 빅데이터 분석기사 필기/실기 시험은 메타코드 온라인 강의를 수강하여 대비하기로 결정하였다.메타코드는 데이터사이언스와 인공지능을 비롯한 전반적인 데이터 직무에 대한 교육을 받을 수 있는 교육 사이트이다.메타코드에서 서포터즈를 뽑는다는 공지를 보고 데이터분석 직무에 대한 공부를 하겠다는 마음가짐과 성실성을 어필하게 되었고,좋은 기회를 받아 이번 5기 서포터즈에 합류하게 되었다.메타코드 서포터즈 첫 활동으로, 2024 빅분기 실기 강의에 대한 내용의 일부와 그 후기를 작성하고자 한다.       예제로 이해하기 1 (단일표본 t-test)                                                             양측검정- 문제 : mtcars data의 mpg열 데..

[2024 빅분기 실기] 메타코드 강의 후기 | 3유형 (1)

이번 8회 빅데이터 분석기사 필기/실기 시험은 메타코드 온라인 강의를 수강하여 대비하기로 결정하였다.메타코드는 데이터사이언스와 인공지능을 비롯한 전반적인 데이터 직무에 대한 교육을 받을 수 있는 교육 사이트이다.메타코드에서 서포터즈를 뽑는다는 공지를 보고 데이터분석 직무에 대한 공부를 하겠다는 마음가짐과 성실성을 어필하게 되었고,좋은 기회를 받아 이번 5기 서포터즈에 합류하게 되었다.메타코드 서포터즈 첫 활동으로, 2024 빅분기 실기 강의에 대한 내용의 일부와 그 후기를 작성하고자 한다.       3유형, 같이 학습할 내용1. 가설검정                                                                                      - 모평균 검정..

빅데이터 분석기획 - 데이터수집 및 저장계획

데이터 수집 및 전환 1. 데이터 수집★ 데이터 유형에 따른 빅데이터 수집기법(★) - 종류 꼭 기억해두기!1. 정형데이터2. 반정형데이터3. 비정형데이터  2. 데이터 변환- ETL : DW, DM에 저장하기 위해 Extract(추출), Transform(변환), Load(적재) 하는 기술           데이터 이동 및 변환이 주 목적임  3. 데이터 비식별화- 5가지 처리기법 및 예시까지 외우기!(★)  4. 데이터 품질검증정형데이터의 품질기준(5가지 암기!)1. 완전성 : 데이터 누락이 없어야 함2. 유일성 : 데이터 중복이 없어야 함3. 유효성 : 정해진 데이터 범위 혹은 도메인을 만족해야 함4. 일관성 : 데이터 구조, 형태가 일관되어야 함5. 정확성 : 실제 객체의 표현값을 정확히 반영해야..

빅데이터 분석기획 - 데이터 분석 계획

분석방안 수립 1. 분석의 기획최적화(Optimization)- 대상/방법을 알고 있기 때문에 문제를 최적화인사이트(Insight)- 대상을 모르고 방법은 알고 있는 상태로 인사이트를 얻을 수 있음솔루션(Solution)- 대상은 알고 방법은 모르기 때문에 솔루션을 찾아 분석을 수행함탐색(Discovery)- 대상/방법 둘 다 모르기 때문에 탐색을 통해 분석대상을 찾아야 함  ※ 분석 거버넌스 체계: 데이터 분석 업무를 고도화 하기 위해서는 데이터 분석 및 활용이 가능할 수 있도록 체계적인 관리가 중요함 구성요소1. Organization(분석기획/관리 수행조직)2. Process(과제기획 및 운영 프로세스)3. System(데이터분석 관련 시스템)4. Data5. Human Resource(교육/마인드..

빅데이터 분석기획 - 빅데이터의 이해

빅데이터 개요 및 활용 1. 빅데이터 : 대용량의 자료(정형/비정형 데이터) -> + 데이터에서 가치 추출/의사결정에 활용 2. 빅데이터 3V(7V) 특징 - 가트너 그룹 3. 정형/반정형/비정형 데이터 특징(★) 4. 정성적/정량적 데이터  ※ 참고사항 : 데이터 바이트 크기  5. 암묵지와 형식지※ 암묵지와 형식지의 상호 작용  - 내면화(형식지->암묵지) : 문서를 개인의 지식으로  - 공통화(암묵지->암묵지) : 개인->조직으로 지식공유  - 표출화(암묵지->형식지) : 지식을 문서화  - 연결화(형식지->형식지) : 형식지를 결합하여 새로운 지식 생성 6. DIKW 피라미드 : 데이터-정보-지식을 통해 최종 지혜를 찾아가는 과정- Wisdom(지혜) : A마트가 다른 상품들도 쌀 것이라고 판단-..

빅데이터 탐색 - 데이터전처리(분석변수처리)

분석 변수 처리 3. 파생변수   1 파생변수 : 분석가가 주관적으로 만든 변수(의미부여) -> 주관적으로 만든 변수이기 때문에 논리적으로 타당해야 함   2 요약변수 : 합계, 횟수, 빈도 등의 기본적인 요약 변수, 많은 모델에서 공통으로 사용할 수 있어 재활용성이 높음 4. 변수변환   1 변수의 구간화 : 연속형 변수를 다수의 구간으로 나눔(구간=변수가 된다)       - ex) 점수 70~100점 -> 1등급 : 90~100점                                             2등급 : 80~89점                                             3등급 : 70~79점    2 더미변수(Dummy Variable)    3 원-핫 인코딩..