-
[ADsP 요약] [ADsP 2과목] II. 데이터 분석 기획 (2024 업데이트)자격증/데이터분석 준전문가 (ADsP) 2024. 5. 11. 22:40728x90반응형
데이터분석 준전문가 ADsP 2과목 요약
[2과목] 데이터 분석 기획
I. 데이터 분석 기획의 이해
01. 분석 기획과 분석 방법론
02. 분석 과제 발굴
03. 분석 프로젝트 관리 방안
II. 분석 마스터플랜
01. 마스터플랜 수립
02. 분석 거버넌스 체계 수립
I. 데이터 분석 기획의 이해
01. 분석 기획과 분석 방법론 — 1. 분석 기획
[1] 분석 기획(1) 분석 기획 | 분석 수행 전에 필요한 중요한 사전 작업
- 실제 분석을 수행하기 전, 과제 정의 및 관리 방안을 사전에 계획하는 작업
- 어떠한 목표를 달성하기 위해, 어떤 데이터를 가지고, 어떤 방식으로 수행할지에 대한 계획 수립
(2) 분석 기획 유형 | 분석 대상과 그 방법에 따른 4가지 분석 기획 - 최적화, 솔루션, 통찰, 발견
최적화 Optimization 해결 Solution 통찰 Insight 발견 Discovery - 분석 대상 알고 있음 O
- 분석 방법 알고 있음 O- 분석 대상 알고 있음 O
- 분석 방법 모름 X- 분석 대상 모름 X
- 분석 방법 알고 있음 O- 분석 대상 모름 X
- 분석 방법 모름 X(3) 목표 시점별 분석 기획 | 분석 과제를 언제 해결해야 하는가에 따라 - 과제 중심, 마스터플랜 방식
과제 중심적인 접근 방식 (과제 단위) 장기적, 지속적 분석 내재화 (마스터플랜 단위) - 빠르게 해결하는 것이 목적 - 지속적인 분석 내재화가 목적 - 빠른 수행, 문제 해결이 목적 (Speed & Test) - 정확도, 문제 정의가 목적 (Accuracy & Deploy) - 분석 과제 유형은 Quick & Win - 분석 과제 유형은 Long term view - 과제 접근 방식은 Problem Solving - 과제 접근 방식은 Problem Definition (4) 분석 기획 시 고려사항 | 가용 데이터, 활용방안 탐색, 장애요소 고려
가용 데이터 고려 적절한 활용방안, 유스케이스 탐색 장애요소에 대한 사전계획 수립 - 데이터 확보 가능 여부,
- 데이터 유형에 대한 분석이 먼저 필요함- 기존의 유사시나리오 및 솔루션 활용
- 과거의 유사한 분석사례를 참조- 발생 가능한 장애요소에 대한
사전계획 수립 필요함
01. 분석 기획과 분석 방법론 — 2. 분석 방법론 개요
[1] 분석 방법론(1) 분석 방법론 | 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물로 구성됨
분석 방법론의 필요성 분석 방법론 생성과정: 암묵지 → 형식지 → 방법론 - 체계화된 절차와 방법,
- 일정한 품질 수준의 산출물,
- 프로젝트의 성공 가능성 확보가 필요
- 기업의 합리적 의사결정을 방해하는 요소는
고정 관념, 편향된 생각, 프레이밍 효과[2] 업무 특성에 따른 모델 | 폭포수, 프로토타입, 나선형, 계층적 프로세스 모델
(1) 분석 방법론이 적용되는 업무 특성에 따른 모델
폭포수 모델 프로토타입 모델 나선형 모델 계층적 프로세스 모델 - 단계를 거쳐 순차적 진행 - 사용자 중심 개발 방법 - 반복을 통해 점층적 개발 - 구성: 단계, 태스크, 스텝 - 하향식 방향으로 진행
- 문제발견 시 이전단계로 회귀- 일부 개발 → 점진적 개선
- 고객니즈 이해가 부족한 경우!고객니즈보다 위험요소를
사전 제거하는 데에 초점최상계층이 단계고, 한 단계는 여러
태스크, 한 태스크는 여러 스텝(2) 계층적 프로세스 모델
단계 Phase 태스크 Task 스텝 Step - 단계별로 산출물 생성
- 하나의 단계는 여러 태스크로 구성됨
- 버전 관리 등을 통한 통제 필요함- 단계를 구성하는 단위 활동
- 물리적 또는 논리적 단위임
- 하나의 태스크는 여러 스텝으로 구성됨
- 품질검토 항목이 될 수 있음- WBS의 워크패키지에 해당함
- (입력자료 - 처리 & 도구 - 출력자료) 로
구성된 단위 프로세스임
01. 분석 기획과 분석 방법론 — 3. 전통적인 분석 방법론
KDD 분석 방법론 CRISP-DM 분석 방법론 통계적 패턴, 지식을 찾기 위해 체계적으로
정리한 데이터마이닝 프로세스- 1999, 유럽연합에서 발표한 계층적 프로세스 모델
- 단계, 일반화 태스크, 세분화 태스크, 프로세스 실행데이터셋 선택 - 전처리 - 데이터 변환 - 데이터마이닝 - 결과 평가 업무 이해 - 데이터 이해 - 데이터 준비 - 모델링 - 평가 - 전개 [1] KDD 분석 방법론
(1) 데이터셋 선택 (2) 데이터 전처리 (3) 데이터 변환 (4) 데이터 마이닝 (5) 해석 및 결과평가 - 비즈니스 도메인 이해
- 프로젝트 목표 설정
- 타겟 데이터 생성- 전처리: 잡음, 이상치,
결측치 파악 및 제거
- 의미있는 데이터 재가공- 변수 생성, 선택
- 데이터 차원 축소
- 학습용, 검증용 분리- 학습 데이터를 이용
- 데이터마이닝 기법 선택
- 적절한 알고리즘 적용- 목적과의 일치성 확인
- 분석 결과 평가
- 업무 활용 방안 마련[2] CRISP-DM 분석 방법론
(1) 업무 이해 (2) 데이터 이해 (3) 데이터 준비 (4) 모델링 (5) 평가 (6) 전개 - 업무 목적 파악
- 상황 파악
- 계획 수립- 초기 데이터 수집
- 데이터 기술 분석
- 탐색, 품질 확인- 분석데이터셋 선택
- 데이터 정제
- 편성, 통합, 포맷- 모델링 기법 선택
- 테스트 계획 설계
- 모델 작성, 평가- 분석 결과 평가
- 모델링 과정 평가
- 모델 적용성 평가- 전개 계획 수립
- 모니터링, 유지
보수 계획 수립
01. 분석 기획과 분석 방법론 — 4. 빅데이터 분석 방법론
[1] 빅데이터 분석 방법론 | 완벽한 계층적 프로세스 모델 - 5단계, 3레벨(1) 빅데이터 분석 방법론의 계층적 프로세스
- 5단계: 분석 기획 → 데이터 준비 → 데이터 분석 → 시스템 구현 → 평가 및 전개
- 각 단계는 여러 태스크, 각 태스크는 여러 스텝들로 이루어져 있으며, 순차적으로 진행됨
단계 (1) 분석 기획 (2) 데이터 준비 (3) 데이터 분석 (4) 시스템 구현 (5) 평가 및 전개 태스크 - 비즈니스 이해 - 필요 데이터 정의 - 분석용 데이터 준비 - 설계 및 구현 - 모델 발전계획 수립 - 범위 설정 - 데이터 스토어 설계 - 텍스트 분석 - 시스템 테스트 - 프로젝트 평가, 보고 - 프로젝트 정의, 계획 - 데이터 수집 - 탐색적 분석 - 시스템 운영 - 위험 계획 수립 - 정합성 검정 - 모델링 및 평가, 검증 - 모델 적용 - 위험 대응 계획 수립: 예상되는 위험으로부터 대응할 수 있는 방법 - 회피, 전이, 완화, 수용
02. 분석 과제 발굴 — 1. 분석 과제 발굴 개요
[1] 분석 과제 발굴(1) 분석 과제 발굴 | "해결해야 할 기업의 문제"를 "데이터 분석 문제"로 변환
(2) 분석 과제 탐색 방법 | 하향식 접근법, 상향식 접근법
하향식 접근법 (TOP-DOWN) 상향식 접근법 (BOTTOM-UP) - 분석 대상이 무엇인지 알고 있음 O
- 문제탐색 - 문제정의 - 해결방안 탐색 - 타당성 검토
- 최적화 → 솔루션- 분석 대상이 무엇인지 모름 X → 데이터에서 인사이트 발견
- 지도학습, 비지도학습, 프로토타입 방식
- 발견 → 통찰 (인사이트)[2] 디자인 씽킹 Design Thinking
IDEO사의 디자인 씽킹 (더블 다이아몬드 프로세스) 스탠퍼드대학 d.school 디자인 씽킹 (상향식에 해당함) - 문제 발견 + 솔루션 제시
- 발산 (상향식) → 수렴 (하향식) 단계를 반복 수행- 비즈니스 + 기술 + 인간중심사고
- 공감-문제정의-아이디어도출-프로토타입-테스트-평가
02. 분석 과제 발굴 — 2. 하향식 접근법
[1] 하향식 접근법 | 문제 탐색 - 문제 정의 - 해결방안 탐색 - 타당성 검토(1) 1단계: 문제 탐색
비즈니스 모델 탐색 기법 분석기회 발굴범위의 확장 외부참조 모델기반 문제탐색 분석 유스케이스 - 비즈니스 모델 캔버스
9개 영역을 5개로 단순화
- 업무, 제품, 고객, 규제와
감사, 지원 인프라- 거시적 관점: 기업에 주는 영향
- 경쟁자 확대 관점
- 시장의 니즈 탐색 관점
- 역량의 재해석 관점- 유사 동종 업계 벤치마킹
- 가장 빠르고 쉬운 방식
- 브레인스토밍 활용- 현재 유사, 동종 사례 탐색
- 분석 유스케이스:
분석을 적용했을 때 업무
흐름을 개념적으로 설명한 것(2) 2단계: 문제 정의
- 문제 정의: 식별된 비즈니스 문제를 데이터 문제로 변환하여 정의함
- 필요한 데이터, 기법을 정의
- 최종 사용자 관점에서 이루어져야 함
(3) 3단계: 해결방안 탐색
- 정의된 데이터 분석 문제를 해결하기 위한 방안을 모색함
- 현재 기업 수준에서 분석 가능한 시스템을 갖추었는가 + 분석 수행할 인력이 확보되었는가
- 두 가지를 동시에 고려 → 해결방안 탐색단계 프로세스
기존 시스템, 인력으로 수행 역량 확보 (교육&채용) 시스템 고도화 전문업체 아웃소싱 - 기존시스템으로 가능 O
- 분석역량 있음 O- 기존시스템으로 가능 O
- 분석역량 없음 X- 기존시스템으로 불가능 X
- 분석역량 있음 O- 기존시스템으로 불가능 X
- 분석역량 없음 X(4) 4단계: 타당성 검토
경제적 타당성 데이터 및 기술적 타당성 - 분석을 위한 지출항목
- 분석 수행 시 경제적 이득을 고려- 분석 수행 가능 여부
- 데이터 존재 여부, 분석 환경, 분석 역량 고려
02. 분석 과제 발굴 — 3. 상향식 접근법
[1] 상향식 접근법 | 분석 대상을 모름 → 데이터로부터 분석과제 발굴상향식 접근법이란 지도 학습 비지도 학습 프로토타이핑 접근법 - 분석 대상 모름
- 원천 데이터로부터
통찰과 지식을 얻는 방법
- 분석부터 하고, 그 결과로부터
가치있는 문제를 도출함- Supervised Learning
- 정답/라벨이 있는 데이터
- 범주형 - 분류
- 연속형 - 회귀
- 의사결정트리, 인공신경망 등- Unsupervised Learning
- 정답/라벨이 없는 데이터
- 비슷한 특징을 가진
데이터끼리 군집화
- 군집분석, 주성분분석 등- 시행착오 해결법
- 분석 먼저 → 결과 확인
- 조금씩 개선해나감
- 문제 정의가 불명확하고,
새로운 문제인 경우- 프로토타이핑 접근법의 프로세스:
가설 생성 → 디자인에 대한 실험 → 실제 환경에서의 테스트 → 테스트 결과에서 인사이트 도출 & 가설 확인 - 프로토타이핑 접근법이 필요한 경우
- 문제에 대한 인식수준 낮음 / 문제가 불명확한 경우
- 필요 데이터의 존재여부가 불확실함
- 데이터 사용 목적이 변화함 (고정되지 않음)
03. 분석 프로젝트 관리 방안
[1] 분석 프로젝트분석 프로젝트의 특성 분석과제의 5가지 주요속성을 고려한 관리 - 분석가의 목표: 정확도를 높이는 것 & 사용자의 원활한 활용
- 데이터 영역, 비즈니스 영역의 중간에서 조율
- 도출된 결과 재해석을 통한 지속적인 모델 정교화
- 모델 개선을 위한 관리 방안 수립 필요함- 데이터 양: 방대하다면 하둡, 클라우드 등을 활용
- 데이터 속도: 실시간 전달 고려
- 데이터, 분석 복잡도: 정확도와 복잡도는 트레이드오프 관계
- 정확도(Accuracy) & 정밀도(Precision)
II. 분석 마스터플랜
01. 마스터플랜 수립 — 1. 분석 기획
[1] 분석 마스터플랜- 분석 마스터플랜: 하나의 분석 프로젝트를 위한 전체 설계도
- 분석방법론, 과제발굴 수행과정을 모두 아우르는 광의의 개념
[2] 분석 마스터플랜 수립 프레임워크
- 우선순위 설정 - 분석과제 적용범위 및 방식 설정 - 분석 구현 로드맵 수립
우선순위 고려 요소 적용범위, 적용방식 고려 요소 - 전략적 중요도
- 비즈니스 성과 / ROI
- 실행 용이성- 업무 내재화 적용 수준
- 분석 데이터 적용 수준
- 기술 적용 수준⇒ 적용 우선순위 설정 ⇒ 분석 구현 로드맵 수립
01. 마스터플랜 수립 — 2. 수행 과제 도출 및 우선순위 평가
[1] 일반적인 IT 프로젝트 우선순위 평가- 전략적 중요도 고려: 전략적 필요성, 시급성
- 실행 용이성 고려: 투자 용이성, 기술 용이성
전략적 중요도 실행 용이성 전략적 필요성 시급성 투자 용이성 기술 용이성 [2] 빅데이터 특징을 고려한 분석 ROI 요소
- ROI 요소: 투자비용 요소, 비즈니스효과 요소
투자비용 요소 Investment 비즈니스 효과 Return 규모 Volume 다양성 Variety 속도 Velocity 가치 Value 데이터 양/규모 데이터 종류/유형 데이터 생성/처리속도 분석 결과 활용 및 실행 [3] ROI 를 활용한 우선순위 평가기준
- 전략적 중요도에 따른 시급성 + 분석 적합성 여부에 따른 난이도
시급성 난이도 - 전략적 중요도에 따른 시급성 판단
- 전략적 가치를 어느 시점이 둘 것인가
- 현재 관점 or 미래의 중장기적 관점- 적용 비용, 범위, 분석 수준 측면에서
- 적용하기 쉬운가 or 어려운가 판단
- 데이터 분석의 적합성 여부를 따져 살펴봄[4] 포트폴리오 4분면 분석을 활용한 우선순위 평가기준
- 시급성 + 난이도를 동시에 고려 → 4가지 유형으로 분류하여 우선순위 결정
포트폴리오 사분면(Quadrant) 분석 사분면별 유형 1사분면: 시급성-현재, 난이도-어려움
2사분면: 시급성-미래, 난이도-어려움
3사분면: 시급성-현재, 난이도-쉬움
4사분면: 시급성-미래, 난이도-쉬움
- 시급성 기준: 3 - 4 - 2 - 1
- 난이도 기준: 3 - 1 - 2 - 4
- 기업 상황에 따라 탄력적으로 운용 가능
01. 마스터플랜 수립 — 3. 이행 계획 수립
[1] 로드맵 수립(1) 단계별 분석 로드맵 수립
- 분석 체계 도입 → 분석 유효성 검증 → 분석 확산 및 고도화
1단계: 분석 체계 도입 2단계: 분석 유효성 검증 3단계: 분석 확산 및 고도화 - 분석 기회 발굴
- 분석 과제 정의
- 분석 로드맵 수립- 분석 과제 수행
- 성과 검증
- 분석 아키텍처 설계- 분석과제를 업무프로세스에 내재화
- 검증 결과 확산
- 활용 시스템 구축 및 고도화(2) 세부 이행계획 수립
기존 구현 방식 Analytics 구현 방식 - 고전적인 폭포수 방식
- 설계 → 구현 → 테스트- 분석데이터 수집/확보 → 준비 → 모델링 및 평가
- 모델링 단계를 반복적으로 수행하여 완성도 향상
02. 분석 거버넌스 체계 수립
[1] 분석 거버넌스 체계분석 거버넌스 분석 거버넌스 체계 구성요소 5가지 - 거버넌스: 기업에서 의사결정을 위한
데이터의 분석, 활용을 위한 체계적인 관리
- 데이터 관리체계 수립- 조직: 분석기획 및 관리 수행,
- 과제 기획 및 운영 프로세스,
- 분석 관련 시스템, 데이터, 육성 체계[2] 데이터 분석 성숙도모델 및 수준진단
(1) 분석 성숙도 & 분석 준비도 → 분석 유형 및 방향성 결정
(2) 분석 준비도 | 데이터 분석 도입 수준을 파악하기 위한 진단방법
- 분석 준비도 평가: 분석 업무 파악, 분석 인력 및 조직, 분석 기법, 분석 데이터, 분석 문화, IT 인프라
(3) 분석 성숙도 | 3부문 대상으로 평가 - 비즈니스, 조직 및 역량, IT 부문
1단계: 도입 2단계: 활용 3단계: 확산 4단계: 최적화 - 분석 시작
- 환경, 시스템 구축분석 결과를
업무에 적용전사 차원에서
분석 관리, 공유분석을 진화시켜
혁신, 성과향상에 기여(4) 분석 수준 진단 결과 | 분석 준비도 & 분석 성숙도 진단 결과를 4분면 구분
확산형 도입형 정착형 준비형 - 높은 준비도 & 높은 성숙도
- 지속적 확산 가능- 높은 준비도 & 낮은 성숙도
- 데이터 분석 도입 가능- 낮은 준비도 & 높은 성숙도
- 분석의 정착이 필요함- 낮은 준비도 & 낮은 성숙도
- 사전 준비가 필요함[3] 분석 지원 인프라 방안 수립 → 플랫폼으로 인프라 구축
- 플랫폼 구조 도입: 장기적, 안정적으로 활용할 수 있는 확장성을 고려한 플랫폼
- 플랫폼: 서비스를 위한 응용프로그램이 실행될 수 있는 기초를 이루는 컴퓨터 시스템
개별 시스템 플랫폼 구조 - 시스템간 자체적인 데이터 교환
- 시스템별 독립적인 데이터 관리
- 확장 시 시스템 간 인터페이스 폭증- 분석 플랫폼을 활용한 공동기능 활용
- 중앙집중적 데이터 관리
- 시스템간 인터페이스 최소화[4] 데이터 거버넌스 체계 수립
(1) 데이터 거버넌스
- 전사 차원 모든 데이터에 대해 표준화된 관리 체계 수립
- 운영을 위한 프레임워크 및 저장소를 구축하는 것
- 중요한 관리대상: 마스터 데이터, 메타데이터, 데이터 사전 등
- 구성요소: 원칙 (Principle), 조직 (Organization), 프로세스 (Process)
(2) 데이터 거버넌스 체계
데이터 표준화 데이터 관리 체계 데이터 저장소 관리 표준화 활동 - 데이터 표준용어 설정,
- 명명 규칙 수립,
- 메타데이터 구축,
- 데이터 사전 구축 등- 데이터 정합성 및 활용 효율성
을 위한 관리 원칙 수립
- 담당자, 조직별 역할 준비
- 데이터 생명주기 관리방안- 메타데이터, 표준데이터 관리
위한 전사차원 저장소 구성
- 데이터 구조 변경에 따른
사전영향 평가가 필요함- 체계 구축 후, 표준 준수여부를
주기적으로 점검
- 모니터링 실시[5] 데이터 조직 및 인력방안 수립
(1) 데이터 분석 조직
- 기업 경쟁력 확보를 위해, 비즈니스 질문과 부합하는 가치를 찾고, 비즈니스를 최적화하는 것이 목표
- 분석 업무 발굴 & 기업 내 빅데이터에서 가치를 찾아, 전파하고, 행동화하는 역할
집중 구조 기능 구조 분산 구조 조직 내에 독립적인
분석 전담 조직을 구성함해당 부서에서
직접 분석함분석 조직 인력을
현업 부서에 배치함- 전사 분석업무를 전담조직에서 담당
- 장점: 우선순위 정해 추진 가능
- 단점: 중복, 이원화 가능성 있음- 전사적 관점에서 핵심분석 어려움
- 특정 부서에 국한된 분석 가능성
- 일부 중복 가능성 있음- 전사적 관점에서 분석 가능
- 우선순위 선정 가능
- 신속한 실무 적용 가능
참고도서: 2021 ADsP 데이터분석 준전문가_위키북스
728x90반응형'자격증 > 데이터분석 준전문가 (ADsP)' 카테고리의 다른 글
[ADsP 요약] [ADsP 1과목] I. 데이터 이해 (2024 업데이트) (0) 2024.05.08 [ADsP 요약] [ADsP 3과목] III. 데이터 분석 (1) (0) 2021.05.17 [ADsP] [데이터분석 준전문가] 국가공인 데이터분석 준전문가 시험과목 및 내용 (0) 2021.04.22