[데이터자격시험용-필수요약정리]

빅데이터 분석기획 - 빅데이터의 이해

indongspace 2024. 4. 2. 04:17

 

빅데이터 개요 및 활용

 

1. 빅데이터 : 대용량의 자료(정형/비정형 데이터) -> + 데이터에서 가치 추출/의사결정에 활용

 

2. 빅데이터 3V(7V) 특징 - 가트너 그룹

 

3. 정형/반정형/비정형 데이터 특징(★)

 

4. 정성적/정량적 데이터

 

 

※ 참고사항 : 데이터 바이트 크기

 

 

5. 암묵지와 형식지

※ 암묵지와 형식지의 상호 작용

  - 내면화(형식지->암묵지) : 문서를 개인의 지식으로

  - 공통화(암묵지->암묵지) : 개인->조직으로 지식공유

  - 표출화(암묵지->형식지) : 지식을 문서화

  - 연결화(형식지->형식지) : 형식지를 결합하여 새로운 지식 생성

 

6. DIKW 피라미드 : 데이터-정보-지식을 통해 최종 지혜를 찾아가는 과정

★예제를 같이 기억할 것

- Wisdom(지혜) : A마트가 다른 상품들도 쌀 것이라고 판단

- Knowledge(지식) : A마트에 가서 아이스크림을 사야겠다

- Information(정보) : 아이스크림이 A마트가 더 싸다

- Data(데이터) : 아이스크림이 A마트 1000원, B마트 1500원이다

 

7. 빅데이터가 만들어 내는 본질적인 변화

 

8. 빅데이터 조직 및 인력(★)

※ 데이터 사이언티스트 요구역량

1. 하드스킬(Hard Skill)

   - 빅데이터 관련 이론적 지식

   - IT기술, 분석능력 및 노하우

 

2. 소프트스킬(Soft Skill)

   - 설득력 있는 전달(스토리텔링 등)

   - 타 부문과의 협력 스킬

   - 통찰력 있는 분석

 

[데이터 사이언티스트 3대 역량]

 

 

빅데이터 기술 및 제도

 

1. 빅데이터 플랫폼(빅데이터 분석을 위한 IT환경)

- 다양한 대량의 데이터를 처리하기 위해 수집, 저장, 처리, 분석, 시각화 등을 제공해줌

★ 하둡 에코시스템(Hadoop Ecosystem)

★ 각각의 항목에 어떤 기술들이 있는지 알아두기!

 

2. 개인 정보 법●제도

- 빅데이터 시대의 위기와 통제방안

 

- 데이터 3법(2020년) : 개인정보보호법, 정보통신망법, 신용정보법

- 개인을 식별할 수 없도록 안전하게 처리된 가명정보의 개념을 도입하자는게 핵심임

 

- 가명처리

- 사전준비 - 가명처리 - 적정성 검토 및 추가처리 - 활용 및 사후관리