[데이터자격시험용-필수요약정리]

빅데이터 분석기획 - 데이터 분석 계획

indongspace 2024. 4. 2. 04:53

 

분석방안 수립

 

1. 분석의 기획

최적화(Optimization)

- 대상/방법을 알고 있기 때문에 문제를 최적화

인사이트(Insight)

- 대상을 모르고 방법은 알고 있는 상태로 인사이트를 얻을 수 있음

솔루션(Solution)

- 대상은 알고 방법은 모르기 때문에 솔루션을 찾아 분석을 수행함

탐색(Discovery)

- 대상/방법 둘 다 모르기 때문에 탐색을 통해 분석대상을 찾아야 함

 

 

※ 분석 거버넌스 체계

: 데이터 분석 업무를 고도화 하기 위해서는 데이터 분석 및 활용이 가능할 수 있도록 체계적인 관리가 중요함

 

구성요소

1. Organization(분석기획/관리 수행조직)

2. Process(과제기획 및 운영 프로세스)

3. System(데이터분석 관련 시스템)

4. Data

5. Human Resource(교육/마인드 육성체계)

 

※분석 마스터 플랜

: 분석 대상이 되는 과제 도출하고 우선순위를 평가해서 단기적인 세부이행계획, 중장기적인 로드맵 작성 필요

 

 

※ 기업의 분석수준 진단

- 준비형 : 데이터, 인력, 조직, 분석기법 등이 적용되어 있지 않아 사전준비가 필요한 기업

- 정착형 : 준비도는 낮으나 조직, 인력, 분석업무, 기법 등을 기업 내부에서 제한적으로 사용하고 있어 1차적으로 정착이 필요한 기업

- 도입형 : 분석업무, 기법 등은 부족하지만 적용조직 등 준비도가 높아 바로 도입할 수 있는 기업

- 확산형 : 기업에 필요한 6가지 분석 구성요소를 갖추고 있고, 부분적으로 도입되어 있어서 지속 확산이 필요한 기업

 

 

 

2. 분석과제 발굴 및 문제 정의

 

1) 하향식 접근(Top-down)

- 과제 도출 과정 : 문제탐색 -> 문제정의 -> 해결방안탐색 -> 타당성 검토(과제선정)

2) 상향식 접근(Bottom-up)

- 다양한 원천 데이터를 분석해서 문제들을 도출하는 방법

- 기존 하향식 접근 방식의 한계를 극복하기 위해 등장

   (최근에는 데이터들이 다양하고 문제가 복잡하기 때문에 상향식 접근으로 문제를 발굴 함)

※ 프로토타이핑 방법론(상향식 접근방법)

- 일단 분석 해보고 결과를 점진적으로 개선해나가는 방법

 

포트폴리오 사분면 분석을 통한 과제 우선순위 선정 방법

시급성 기준 : Ⅲ → Ⅳ → Ⅱ

난이도 기준 : Ⅲ → Ⅰ → Ⅱ

 

 

 

3. 데이터 분석 방안

 

1) 빅데이터 분석 방법론(★)  : 분석 순서 및 각 순서에서 어떤 활동하는지 암기!

2) KDD 분석 방법론(Knowledge Discovery in Database) - 5단계

- 데이터로부터 패턴이나 지식을 찾기 위해 체계적으로 정리한 방법론

3) CRISP-DM 분석방법론 - 6단계

- 각 단계별 피드백을 통한 단계별 완성도 향상