빅데이터 개요 및 활용
1. 빅데이터 : 대용량의 자료(정형/비정형 데이터) -> + 데이터에서 가치 추출/의사결정에 활용
2. 빅데이터 3V(7V) 특징 - 가트너 그룹
3. 정형/반정형/비정형 데이터 특징(★)
4. 정성적/정량적 데이터
※ 참고사항 : 데이터 바이트 크기
5. 암묵지와 형식지
※ 암묵지와 형식지의 상호 작용
- 내면화(형식지->암묵지) : 문서를 개인의 지식으로
- 공통화(암묵지->암묵지) : 개인->조직으로 지식공유
- 표출화(암묵지->형식지) : 지식을 문서화
- 연결화(형식지->형식지) : 형식지를 결합하여 새로운 지식 생성
6. DIKW 피라미드 : 데이터-정보-지식을 통해 최종 지혜를 찾아가는 과정
- Wisdom(지혜) : A마트가 다른 상품들도 쌀 것이라고 판단
- Knowledge(지식) : A마트에 가서 아이스크림을 사야겠다
- Information(정보) : 아이스크림이 A마트가 더 싸다
- Data(데이터) : 아이스크림이 A마트 1000원, B마트 1500원이다
7. 빅데이터가 만들어 내는 본질적인 변화
8. 빅데이터 조직 및 인력(★)
※ 데이터 사이언티스트 요구역량
1. 하드스킬(Hard Skill)
- 빅데이터 관련 이론적 지식
- IT기술, 분석능력 및 노하우
2. 소프트스킬(Soft Skill)
- 설득력 있는 전달(스토리텔링 등)
- 타 부문과의 협력 스킬
- 통찰력 있는 분석
[데이터 사이언티스트 3대 역량]
빅데이터 기술 및 제도
1. 빅데이터 플랫폼(빅데이터 분석을 위한 IT환경)
- 다양한 대량의 데이터를 처리하기 위해 수집, 저장, 처리, 분석, 시각화 등을 제공해줌
★ 하둡 에코시스템(Hadoop Ecosystem)
★ 각각의 항목에 어떤 기술들이 있는지 알아두기!
2. 개인 정보 법●제도
- 빅데이터 시대의 위기와 통제방안
- 데이터 3법(2020년) : 개인정보보호법, 정보통신망법, 신용정보법
- 개인을 식별할 수 없도록 안전하게 처리된 가명정보의 개념을 도입하자는게 핵심임
- 가명처리
- 사전준비 - 가명처리 - 적정성 검토 및 추가처리 - 활용 및 사후관리
'[데이터자격시험용-필수요약정리]' 카테고리의 다른 글
빅데이터 분석기획 - 데이터수집 및 저장계획 (0) | 2024.04.02 |
---|---|
빅데이터 분석기획 - 데이터 분석 계획 (0) | 2024.04.02 |
빅데이터 탐색 - 데이터전처리(분석변수처리) (0) | 2024.04.01 |
빅데이터 탐색 - 데이터전처리(차원축소/피처 추출방법) (0) | 2024.04.01 |
빅데이터 탐색 - 데이터전처리(데이터축소변환/분석변수처리) (0) | 2024.04.01 |