전체 글
-
[빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 01. 분석 모형 설계 (1)자격증/빅데이터분석기사-필기 2021. 3. 17. 23:22
빅데이터분석기사 필기 요약🔑 분석모형/ 통계기반/ 기술통계/ 상관분석/ 회귀분석/ 분산분석/ 주성분분석/ 판별분석/ 데이터마이닝/ 분류/ 예측/ 군집화/ 연관규칙/ 머신러닝/ 지도학습/ 비지도학습 III. 빅데이터 모델링 01. 분석 모형 설계 1. 분석 절차 수립 1. 분석 절차 수립 [1] 분석 모형 선정 분석 목적 부합 & 데이터 변수 고려 → 분석 모형 선정모형(모델): 객체/ 시스템/ 개념에 대한 구조나 작업을 보여주기 위한 패턴/ 계획/ 설명탐색적 데이터 분석 (EDA): 현상에서 패턴 발견통계적 추론: 현상에서 결론 도출기계학습: 현상을 예측빅데이터 분석 모형통계 기반데이터마이닝 기반머신러닝 기반기술통계상관분석회귀분석분산분석주성분분석판별분석통계적기법 - 로지스..
-
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 03. 통계기법 이해 (3)자격증/빅데이터분석기사-필기 2021. 3. 17. 14:57
빅데이터분석기사 필기 요약🔑 추론통계/ 점추정/ 불편성/ 효율성/ 일치성/ 충족성/ 구간추정/ 신뢰수준/ 신뢰구간/ 가설검정/ 귀무가설/ 대립가설/ 제 1종 오류/ 제 2종 오류/ 검정통계량/ p-value II. 빅데이터 탐색 03. 통계기법 이해 1. 기술 통계 2. 추론 통계 2. 추론 통계 [1] 점 추정 (1) 점 추정 (Point Estimation) | 모수를 하나의 값으로 추정점 추정- 표본의 정보로부터- 모집단의 모수를- 하나의 값으로 추정하는 기법점 추정 조건: 불편성/ 효율성/ 일치성/ 충족성- 불편성 (Unbiasedness): 모든 표본의 추정량들의 기댓값 = 모수- 효율성 (Efficiency): 추정량의 분산이 작..
-
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 03. 통계기법 이해 (2)자격증/빅데이터분석기사-필기 2021. 3. 17. 00:20
빅데이터분석기사 필기 요약🔑 표본추출/ 확률분포/ 포아송분포/ 베르누이분포/ 이항분포/ 정규분포/ 표준정규분포/ T-분포/ 카이제곱분포/ F-분포/ 표본분포 II. 빅데이터 탐색 03. 통계기법 이해 1. 기술 통계 1. 기술 통계 [2] 표본 추출 (1) 표본 추출 기법 | 단순 무작위/ 계통/ 층화/ 군집 추출단순 무작위 추출: 정해진 규칙없이 표본 추출계통 추출: 일정한 간격으로 표본 추출층화 추출: 여러 계층 나눔 → 계층별로 무작위 추출- 계층: 내부 동질/ 외부 이질- (ex) 지역별 여론조사군집 추출: 여러 군집 나눔 → 일부 군집의 전체 or 일부 추출- 군집: 계층과 다르게 성질 고려X (2) 자료 측정 (Measurement) | 대상의 특정..
-
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 03. 통계기법 이해 (1)자격증/빅데이터분석기사-필기 2021. 3. 16. 12:20
빅데이터분석기사 필기 요약🔑 기술통계/ 기초통계량/ 평균/ 중위수/ 최빈값/ 범위/ 분산/ 표준편차/ 평균의 표준오차/ 분포(첨도, 왜도)/ 상관분석/ 회귀분석/ 선형성/ 등분산성/ 독립성/ 비상관성/ 정규성/ 분산분석/ 주성분분석/ 판별분석 II. 빅데이터 탐색 03. 통계기법 이해 1. 기술 통계 1. 기술 통계 기술 통계 (Descriptive Statistics)- 데이터 분석을 목적으로 수집된 데이터를- 확률·통계적으로- 정리·요약하는 기초적인 통계기술통계 목적: 분석 초기 단계에, 데이터 분포의 특징을 파악하고자 함!기술통계 방법- 통계적 수치 계산: 평균/ 분산/ 표준편차- 그래프 활용: 막대 그래프/ 파이 그래프- 를 통해 데이터에 대한 전반적인 이해..
-
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 02. 데이터 탐색 (2)자격증/빅데이터분석기사-필기 2021. 3. 15. 17:41
빅데이터분석기사 필기 요약🔑 중심경향성/ 산포도/ 분포/ 히스토그램/ 막대형 그래프/ 박스 플롯/ 산점도/ 시공간 데이터/ 다변량 데이터/ 비정형 데이터 II. 빅데이터 탐색 02. 데이터 탐색 1. 데이터 탐색 기초 2. 고급 데이터 탐색 1. 데이터 탐색 기초 [3] 기초통계량 추출 및 이해 (1) 기초통계량 구분 | 중심 경향성/ 산포도/ 분포중심 경향성산포도분포평균중위수최빈값범위분산표준편차변동계수사분위 수 범위왜도첨도 (2) 중심 경향성의 통계량 | 평균/ 중위수/ 최빈값평균 (Mean): (변수 값들의 합) / (변수 개수)- 이상값에 의한 변동 변화 심함중위수 (Median): 크기 순서로 오름차순 정렬 → 중앙에 위치한 값- 변수 홀수 개:..
-
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 02. 데이터 탐색 (1)자격증/빅데이터분석기사-필기 2021. 3. 15. 13:31
빅데이터분석기사 필기 요약🔑 데이터 탐색/ EDA/ Four R's/ 저항성/ 잔차해석/ 자료재표현/ 현시성/ 상관관계 분석/ 산점도/ 공분산(경향)/ 상관계수(방향+강도) II. 빅데이터 탐색 02. 데이터 탐색 1. 데이터 탐색 기초 1. 데이터 탐색 기초 [1] 데이터 탐색 개요 (1) 데이터 탐색의 개념데이터 탐색- 데이터 분석 전,- 그래프나 통계적인 방법으로 다양한 각도에서- 데이터 특징을 파악하고, 직관적으로 보는 분석방법데이터 탐색 도구: 도표/ 그래프/ 요약통계 (2) 탐색적 데이터 분석 (EDA; Exploratory Data Analysis) 의 4가지 주제 | 저항성/ 잔차해석/ 자료재표현/ 현시성Four R's: Resistance/ Resi..
-
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 01. 데이터 전처리 (4)자격증/빅데이터분석기사-필기 2021. 3. 14. 22:02
빅데이터분석기사 필기 요약🔑 차원축소/ 주성분분석(PCA)/ 특이값분해(SVD)/ 요인분석/ 독립성분분석(ICA)/ 다차원척도법(MDS)/ 파생변수/ 변수변환/ 단순 기능 변환/ 비닝/ 정규화/ 표준화/ 불균형 데이터 처리/ 임곗값이동/ 앙상블기법 언더샘플링/ ENN/ 토멕 링크 방법/ CNN/ OSS/ 오버샘플링/ SMOTE/ Borderline-SMOTE/ ADASYN II. 빅데이터 탐색 01. 데이터 전처리 1. 데이터 정제 2. 분석 변수 처리 2. 데이터 정제 [2] 차원축소 (1) 차원축소(Dimensionality Reduction) 개념차원축소- 분석대상인 여러 변수의- 정보를 최대한 유지하면서- 변수 개수를 최대한 줄..
-
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 01. 데이터 전처리 (3)자격증/빅데이터분석기사-필기 2021. 3. 14. 18:46
빅데이터분석기사 필기 요약🔑 변수/ 종속변수/ 독립변수/ 변수선택/ 필터기법/ 정보 소득/ 카이제곱 검정/ 피셔 스코어/ 상관계수/ 래퍼기법/ 전진선택법/ 후진제거법/ 단계적방법/ RFE/ SFS/ 유전 알고리즘/ 단변량 선택/ mRMR/ 임베디드기법/ 라쏘/ 릿지/ 엘라스틱넷/ SelectFromModel II. 빅데이터 탐색 01. 데이터 전처리 1. 데이터 정제 2. 분석 변수 처리 2. 데이터 정제 [1] 변수 선택 (1) 변수 개념변수(Feature): 데이터 모델에서 예측에 사용되는 입력변수RDBMS에서 속성/열 = 머신러닝에서 변수변수 유형: 알려진 값 & 예측값- 알려진 값: 변수/ 속성/ 예측변수/ 차원/ 관측치/ 독립변수- 예측 ..