-
[빅데이터분석기사 필기 요약] IV.빅데이터 결과 해석 - 02. 분석 결과 해석 및 활용 (2)자격증/빅데이터분석기사-필기 2021. 4. 3. 18:08728x90반응형
빅데이터분석기사 필기 요약
🔑 시간시각화/ 막대그래프/ 누적 막대그래프/ 선그래프/ 영역차트/ 계단식그래프
공간시각화/ 등치지역도/ 등치선도/ 도트맵/ 도트플롯맵/ 버블맵/ 버블플롯맵/ 카토그램
관계시각화/ 산점도/ 산점도 행렬/ 버블차트/ 히스토그램
비교시각화/ 플로팅바차트/ 히트맵/ 체르노프페이스/ 스타차트/ 평행좌표그래프/ 인포그래픽
IV. 빅데이터 결과 해석
02. 분석 결과 해석 및 활용
1. 분석 결과 해석
2. 분석 결과 시각화
2. 분석 결과 시각화
[1] 시공간 시각화
(1) 시간 시각화 | 시간에 따른 데이터 변화를 표현
- 주요 관심요소: 경향성/트렌드/추세
- 시간 시각화 유형: 막대그래프/ 누적 막대그래프/ 선그래프/ 영역차트/ 계단식그래프
막대그래프 누적 막대그래프 선 그래프 영역 차트 계단식 그래프 Bar Graph Stacked Bar Graph Line Graph Area Chart Step Line Graph - 동일 너비 막대 여러개
- 막대: 특정 범주
- R: geom_bar()- 전체 비율 보여줌
- 여러 범주를 동시에
차트로 표현 가능- 점: 수량
- 점들을 선분으로 이음
- 시간에 따른 크기변화- 색을 채운 영역
- y축 값은 0부터 시작
- 시간에 따른 크기변화- 변화가 생길 때까지
x축과 평행한 선 유지
- 값이 변하는 지점에서
급격하게 뛰어오름(2) 공간 시각화 | 지도 상에 해당하는 정보를 표현
- 대부분 위도&경도 사용함
- R에서 정적/동적인 방법으로 시각화 가능
- 정적 공간 시각화 패키지: maps, mapproj, maptools, mapplots
- 동적 공간 시각화 패키지: RgoogleMaps, ggmap - 공간 시각화 유형: 등치지역도/ 등치선도/ 도트맵/ 도트플롯맵/ 버블맵/ 버블플롯맵/ 카토그램
등치지역도 등치선도 도트맵/ 도트 플롯맵 버블맵/ 버블 플롯맵 카토그램 Choropleth Map Isometric Map Dot (Plot) Map Bubble (Plot) Map Catogram - 색상으로 구분
- 데이터값 크기에 따라
채도/ 밝기 변화
- 인구밀도가 다른 경우
왜곡되는 결점 존재함..- 등치지역도 결점 극복
- 데이터값 크기에 따라
색상 농도 변화- 산점도처럼 점으로 표현
- 활용: 시간 경과에 따라
점진적인 확산을
나타내는 경우- 데이터값 크기에 따라
서로 다른 크기의
원형으로 표시- 데이터값 크기에 따라
면적을 왜곡시킴
- 지리적 형상크기를 조절
- 재구성된 지도
[2] 관계 시각화
(1) 관계 시각화
- 관계 시각화란
- 다변량 데이터 사이에 존재하는
- 변수간 연관성/ 분포/ 패턴을 찾는 시각화 방법 - 상관관계를 시각화하는 기법
- 한 가지 요소의 변화가
- 다른 요소의 변화와 관련이 있는지
- 표현하는 시각화 방법 - 관계 시각화 유형: 산점도/ 산점도 행렬/ 버블차트/ 히스토그램
산점도 산점도 행렬 버블 차트 히스토그램 Scatter Plot Scatter Plot Matrix Bubble Chart Histogram - 두 변수 각각 X축, Y축
- (X, Y) 순서쌍이 하나의 점!
- R: geom_point()
- 상관관계/ 군집화/ 이상값 패턴
파악에 유용함- 다변량 변수 데이터에서
- 가능한 모든 변수 쌍에 대한
- 산점도를 행렬 형태로 표현- 산점도의 점/마크에
- 여러 의미를 부여하여
- 확장된 차트- 자료분포 형태를
직사각형 형태로 시각화
- 특정 변수에 대한
구간별 빈도수
[3] 비교 시각화
(1) 비교 시각화 | 다변량 변수 데이터를 제한된 2차원에 효과적으로 표현
- 비교 시각화 유형: 플로팅바차트/ 히트맵/ 체르노프페이스/ 스타차트/ 평행좌표그래프
플로팅 바 차트 히트맵 체르노프 페이스 스타 차트 평행 좌표 그래프 Floating Bar Chart Heat Map Chernoff Faces Star Chart Parallel Coordinates - 최소~최대 수치까지
막대가 걸쳐있게 표현
- 범주 내 값의 다양성,
중복 및 이상값 파악
- 간트차트라고도 부름- 여러 변수를 비교
- 각 변수는 열 방향
- 칸 별로 색상 구분
- 최솟값 옅은 색
- 최댓값 진한 색- 얼굴 하나로 표현
- 데이터를 눈코입 등과
일대일 대응- 각 변수의 표시 지점을
연결하여 별모양
도형으로 나타냄
- 최솟값은 중심점
- 최댓값은 가장 먼 끝점- 다변량 데이터를
평면에 가시화
[4] 인포그래픽
(1) 인포그래픽 (Infographics)
- 인포그래픽
- 중요 정보를 하나의 그래픽으로 표현함
- 복잡하고 어려운 정보/데이터를 쉽고 명확하게 이해할 수 있도록!
- 그래픽과 텍스트가 균형을 이루도록 조합 - 인포그래픽 유형: 지도형/ 도표형/ 스토리텔링형/ 타임라인형/ 비교분석형/ 만화형
- 활용방법: 퍼블릭 데이터 활용/ 템플릿과 아이콘 배치/ 무료 툴 활용/ 저작권 설정/ 인포그래픽스 홍보
참고 도서: 빅데이터분석기사 필기_수제비 2021
728x90반응형'자격증 > 빅데이터분석기사-필기' 카테고리의 다른 글
[빅데이터분석기사 필기 요약] IV.빅데이터 결과 해석 - 02. 분석 결과 해석 및 활용 (4) (0) 2021.04.06 [빅데이터분석기사 필기 요약] IV.빅데이터 결과 해석 - 02. 분석 결과 해석 및 활용 (3) (0) 2021.04.05 [빅데이터분석기사 필기 요약] IV.빅데이터 결과 해석 - 02. 분석 결과 해석 및 활용 (1) (0) 2021.04.02 [빅데이터분석기사 필기 요약] IV.빅데이터 결과 해석 - 01. 분석 모형 평가 및 개선 (4) (0) 2021.04.01 [빅데이터분석기사 필기 요약] IV.빅데이터 결과 해석 - 01. 분석 모형 평가 및 개선 (3) (0) 2021.03.29