ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [빅데이터분석기사 필기 요약] IV.빅데이터 결과 해석 - 02. 분석 결과 해석 및 활용 (1)
    자격증/빅데이터분석기사-필기 2021. 4. 2. 21:09
    728x90
    반응형

    빅데이터분석기사 필기 요약

    🔑 데이터시각화/ 시간시각화/ 분포시각화/ 관계시각화/ 비교시각화/ 공간시각화/

           시각화도구/ 태블로/ 인포그램/ 차트블록/ 데이터래퍼/

           비즈니스기여도평가/ 총소유비용(TCO)/ 투자대비효과(ROI)/ 순현재가치(NPV)/ 내부수익률(IRR)/ 투자회수기간(PP)

     

    IV. 빅데이터 결과 해석

       02. 분석 결과 해석 및 활용

          1. 분석 결과 해석

     

     

     



     

    1. 분석 결과 해석

     

    [1] 분석 모형 해석

     

    (1) 데이터 시각화 (Data Visualization)

    • 데이터 시각화란
      - 데이터에 대한 이해를 돕기위해,
      - 그림/도형과 같은 그래픽 요소들을 이용하여,
      - 데이터를 묘사/표현하는 과정

    • 데이터 시각화를 어떻게 하는가
      - 선/막대/원 등의 기하나 도형과 같은 양식을 이용하여
      - 데이터 특징을 설명할 수 있는 모양으로 만들거나,
      - 색상/레이블 등의 특성을 활용하여 데이터를 표현한다.

    •  데이터 시각화 기능 구분: 설명/ 탐색/ 표현 기능
      - 설명 기능: 전달하려는 메세지, 주요한 분석결과를 설명 → 사용자에게 명확하게 보여줘야 함!
      - 탐색 기능: 데이터에 숨겨진 관계와 패턴을 찾기 위함 → 사용자가 직접 탐색함
      - 표현 기능: 이야기 전달과 공감을 불러일으키기 위함 → 예술적 표현, 작품

    • 데이터 시각화의 목적: 사용자가 주제에 대해 더 잘 이해하고 느끼게 하는 것!
      - 정보 전달: 전달 & 분석 → 실용적 & 과학적인 측면
      - 설득: 공감 & 설득 → 추상적 & 예술적인 측면

    • 데이터 시각화 절차: 구조화 → 시각화 → 시각표현
      - 구조화: 목표 설정/ 데이터 표현 규칙&패턴 탐색/ 시각화 요건정의/ 시나리오&스토리 구성
      - 시각화: 시각화 도구&기술 선택/ 시각화 구현
      - 시각표현: 그래프 보정&품질향상/ 전달요소 강조/ 인터랙션 기능 적용/ 결과물 검증

     

    (2) 데이터 시각화 유형 | 시간/ 분포/ 관계/ 비교/ 공간 시각화

    시간 시각화 분포 시각화 관계 시각화 비교 시각화 공간 시각화
    시간 흐름에 따른 변화
    경향/트렌드 파악
    분류에 따른 변화를
    최대/최소/전체분포
    등으로 표현
    집단간 상관관계 확인
    → 다른수치 변화 예측
    데이터간
    차이점/유사성 관계확인
    지도를 통해
    시점에 따른
    경향/차이 확인
    막대 그래프
    점 그래프
    파이 차트
    도넛 차트
    트리맵
    산점도
    버블차트
    히스토그램
    히트맵
    평행 좌표 그래프
    체르노프 페이스
    등치선도
    도트맵
    카토그램

     

     

     

    (3) 시각화 분석을 위한 데이터 유형 | 범주 및 비율/ 추세 및 패턴/ 관계 및 연결

    • 범주, 비율: 범위/ 분포/ 순위/ 측정
    • 추세, 패턴: 추세 방향/ 추세 패턴/ 추세 속도/ 변동 패턴/ 중요도/ 교차
    • 관계, 연결: 예외/ 상관성/ 연관성/ 계층 관계
    데이터 유형: 범주 및 비율
    범위 분포 순위 측정
    값의 범위 파악 개별 변수&변수 조합이
    가지는 분포 형태 파악
    크기 기준으로 순서 확인
    최댓값/최솟값/
    중위수/사분위수
    값이 가지는 중요성 파악
    숫자 자체보다
    깊이있는 조사!

     

    데이터 유형: 추세 및 패턴
    추세 방향 추세 패턴 추세 속도 변동 패턴 중요도 교차
    값이 증가/감소 선형/지수형
    or 변화없음
    어느 정도로
    추세가 급한가
    반복 패턴, 변동폭, 무작위 패턴 등 확인한 패턴이
    중요 or 잡음 파악
    변수간 교차(점),
    중첩 발생 여부 확인

     

    데이터 유형: 관계 및 연결
    예외 상관성 연관성 계층 관계
    이상값과 같은
    정상범위 벗어난 변수 파악
    변수간 관련성
    강한/약한 강관관계 존재 확인
    변수와 값의 조합간
    의미있는 관계 파악
    데이터 범주의
    구성/분포/관련성 파악

     

     

     

    (4) 빅데이터 시각화 도구 | 태블로/ 인포그램/ 차트블록/ 데이터래퍼

    • 태블로 (Tableau): 데이터를 클라우드에 저장 → 차트/ 그래프/ 지도 등의 다양한 그래픽 기능 제공
    • 인포그램 (Infogram): 실시간으로 인포그래픽을 연동해줌
    • 차트 블록 (Chart Blocks): 코딩없이 데이터베이스 형태의 데이터를 쉽게 시각화 → 웹기반 차트 구현
    • 데이터 래퍼 (Data Wrapper): 사용자 목적에 따라 제작할 수 있는 레이아웃 제공 → 차트/ 맵으로 데이터를 변환

     

     

     


     

    [2] 비즈니스 기여도 평가

     

    (1) 비즈니스 기여도 평가

    • 비즈니스 기여도 평가
      - 사업수행에 영향을 주는 요소를
      - 수치화된 자료형태로
      - 산출하는 평가방법

    • 비즈니스 기여도 평가지표: 총소유비용/ 투자대비효과/ 순현재가치/ 내부수익률/ 투자회수기간
    총 소유 비용 투자 대비 효과 순 현재가치 내부 수익률 투자 회수 기간
    TCO ROI NPV IRR PP
    한 자산을 획득하려 할때,
    주어진 기간동안
    모든 연관 비용을 고려
    자본 투자에 따른
    순 효과의 비율
    (투자 타당성)
    특정시점
    투자금액과 매출금액의 차이를 이자율로 고려
    순 현재가치를
    0으로 만드는 할인율
    (연단위 기대수익 규모)
    누계 투자금액과 매출금액의 합이 같아지는 기간
    (흑자 전환 시점)

     

    • 고려사항: 효과/ 성능/ 중복/ 최적화 검증
      - 효과 검증: 검출률 증가/ 향상도 개선 등의 효과 제시
      - 성능 검증: 시뮬레이션을 통한 처리량/ 대기시간/ 대기행렬 감소
      - 중복 검증: 타 모델링과의 중복에 따른 효과를 통제/ 제시할 수 있어야 함
      - 최적화 검증: 최적화를 통해 목적함수가 증가한 만큼의 효과 제시

     

    참고 도서: 빅데이터분석기사 필기_수제비 2021

     

    728x90
    반응형