ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [빅데이터분석기사 필기 요약] IV.빅데이터 결과 해석 - 02. 분석 결과 해석 및 활용 (2)
    자격증/빅데이터분석기사-필기 2021. 4. 3. 18:08
    728x90
    반응형

    빅데이터분석기사 필기 요약

    🔑 시간시각화/ 막대그래프/ 누적 막대그래프/ 선그래프/ 영역차트/ 계단식그래프

           공간시각화/ 등치지역도/ 등치선도/ 도트맵/ 도트플롯맵/ 버블맵/ 버블플롯맵/ 카토그램

           관계시각화/ 산점도/ 산점도 행렬/ 버블차트/ 히스토그램

           비교시각화/ 플로팅바차트/ 히트맵/ 체르노프페이스/ 스타차트/ 평행좌표그래프/ 인포그래픽

     

    IV. 빅데이터 결과 해석

       02. 분석 결과 해석 및 활용

          1. 분석 결과 해석

          2. 분석 결과 시각화

     



     

    2. 분석 결과 시각화

     

    [1] 시공간 시각화

     

    (1) 시간 시각화 | 시간에 따른 데이터 변화를 표현

    • 주요 관심요소: 경향성/트렌드/추세
    • 시간 시각화 유형: 막대그래프/ 누적 막대그래프/ 선그래프/ 영역차트/ 계단식그래프
    막대그래프 누적 막대그래프 선 그래프 영역 차트 계단식 그래프
    Bar Graph Stacked Bar Graph Line Graph Area Chart Step Line Graph
    - 동일 너비 막대 여러개
    - 막대: 특정 범주
    - R: geom_bar()
    - 전체 비율 보여줌
    - 여러 범주를 동시에
      차트로 표현 가능
    - 점: 수량
    - 점들을 선분으로 이음
    - 시간에 따른 크기변화
    - 색을 채운 영역
    - y축 값은 0부터 시작
    - 시간에 따른 크기변화
    - 변화가 생길 때까지
      x축과 평행한 선 유지

    - 값이 변하는 지점에서
      급격하게 뛰어오름

     

     

    (2) 공간 시각화 | 지도 상에 해당하는 정보를 표현

    • 대부분 위도&경도 사용함
    • R에서 정적/동적인 방법으로 시각화 가능
      - 정적 공간 시각화 패키지: maps, mapproj, maptools, mapplots
      - 동적 공간 시각화 패키지: RgoogleMaps, ggmap

    • 공간 시각화 유형: 등치지역도/ 등치선도/ 도트맵/ 도트플롯맵/ 버블맵/ 버블플롯맵/ 카토그램
    등치지역도 등치선도 도트맵/ 도트 플롯맵 버블맵/ 버블 플롯맵 카토그램
    Choropleth Map Isometric Map Dot (Plot) Map Bubble (Plot) Map Catogram
    - 색상으로 구분
    - 데이터값 크기에 따라
      채도/ 밝기 변화
    - 인구밀도가 다른 경우
      왜곡되는 결점 존재함..
    - 등치지역도 결점 극복
    - 데이터값 크기에 따라
      색상 농도 변화
    - 산점도처럼 점으로 표현
    - 활용: 시간 경과에 따라
      점진적인 확산을
      나타내는 경우
    - 데이터값 크기에 따라
      서로 다른 크기의
      원형으로 표시
    - 데이터값 크기에 따라
      면적을 왜곡시킴
    - 지리적 형상크기를 조절
    - 재구성된 지도

     

     

     


     

    [2] 관계 시각화

     

    (1) 관계 시각화

    • 관계 시각화란
      - 다변량 데이터 사이에 존재하는
      - 변수간 연관성/ 분포/ 패턴을 찾는 시각화 방법

    • 상관관계를 시각화하는 기법
      - 한 가지 요소의 변화가
      - 다른 요소의 변화와 관련이 있는지
      - 표현하는 시각화 방법

    • 관계 시각화 유형: 산점도/ 산점도 행렬/ 버블차트/ 히스토그램
    산점도 산점도 행렬 버블 차트 히스토그램
    Scatter Plot Scatter Plot Matrix Bubble Chart Histogram
    - 두 변수 각각 X축, Y축
    - (X, Y) 순서쌍이 하나의 점!
    - R: geom_point()

    - 상관관계/ 군집화/ 이상값 패턴
      파악에 유용함
    - 다변량 변수 데이터에서
    - 가능한 모든 변수 쌍에 대한
    - 산점도를 행렬 형태로 표현
    - 산점도의 점/마크에
    - 여러 의미를 부여하여
    - 확장된 차트
    - 자료분포 형태를
      직사각형 형태로 시각화

    - 특정 변수에 대한
      구간별 빈도수

     


     

    [3] 비교 시각화

     

    (1) 비교 시각화 | 다변량 변수 데이터를 제한된 2차원에 효과적으로 표현

    • 비교 시각화 유형: 플로팅바차트/ 히트맵/ 체르노프페이스/ 스타차트/ 평행좌표그래프
    플로팅 바 차트 히트맵 체르노프 페이스 스타 차트 평행 좌표 그래프
    Floating Bar Chart Heat Map Chernoff Faces Star Chart Parallel Coordinates
    - 최소~최대 수치까지
      막대가 걸쳐있게 표현
    - 범주 내 값의 다양성,
      중복 및 이상값 파악

    - 간트차트라고도 부름
    - 여러 변수를 비교
    - 각 변수는 열 방향
    - 칸 별로 색상 구분
    - 최솟값 옅은 색
    - 최댓값 진한 색
    - 얼굴 하나로 표현
    - 데이터를 눈코입 등과
      일대일 대응
    - 각 변수의 표시 지점을
      연결하여 별모양
      도형으로 나타냄

    - 최솟값은 중심점
    - 최댓값은 가장 먼 끝점
    - 다변량 데이터를
      평면에 가시화

     


     

    [4] 인포그래픽

     

    (1) 인포그래픽 (Infographics)

    • 인포그래픽
      - 중요 정보를 하나의 그래픽으로 표현함
      - 복잡하고 어려운 정보/데이터를 쉽고 명확하게 이해할 수 있도록!
      - 그래픽과 텍스트가 균형을 이루도록 조합
    • 인포그래픽 유형: 지도형/ 도표형/ 스토리텔링형/ 타임라인형/ 비교분석형/ 만화형
    • 활용방법: 퍼블릭 데이터 활용/ 템플릿과 아이콘 배치/ 무료 툴 활용/ 저작권 설정/ 인포그래픽스 홍보

     


     

    참고 도서: 빅데이터분석기사 필기_수제비 2021

     

    728x90
    반응형