[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 03. 통계기법 이해 (3)

자격증/빅데이터분석기사-필기 2021. 3. 17. 14:57

728x90

빅데이터분석기사 필기 요약

🔑 추론통계/ 점추정/ 불편성/ 효율성/ 일치성/ 충족성/

구간추정/ 신뢰수준/ 신뢰구간/ 가설검정/ 귀무가설/ 대립가설/
제 1종 오류/ 제 2종 오류/ 검정통계량/ p-value

II. 빅데이터 탐색

03. 통계기법 이해

1. 기술 통계

2. 추론 통계

2. 추론 통계

[1] 점 추정

(1) 점 추정 (Point Estimation) | 모수를 하나의 값으로 추정

점 추정
- 표본의 정보로부터
- 모집단의 모수를
- 하나의 값으로 추정하는 기법
점 추정 조건: 불편성/ 효율성/ 일치성/ 충족성
- 불편성 (Unbiasedness): 모든 표본의 추정량들의 기댓값 = 모수
- 효율성 (Efficiency): 추정량의 분산이 작을수록 좋다~
- 일치성 (Consistency): 표본 크기 아주 커짐 → 추정량 ≈ 모수
- 충족성 (Sufficient): 추정량은 모수에 대한 모든 정보를 제공

(2) 점 추정에 사용되는 통계 | 표본평균/ 표본분산/ 중위수/ 최빈값

[2] 구간 추정

(1) 구간 추정 (Interval Estimation) | 범위로 모수를 추정

구간 추정
- 추정값에 대한 신뢰도를 제시하면서, 범위로 모수를 추정하는 방법
- 추정량의 분포에 대한 전제와
- 구간 안에 모수가 있을 신뢰수준이 주어져야 함
구간 추정 용어: 신뢰수준/ 신뢰구간
- 95% 신뢰수준에서 모집단의 분포를 알고 있는 경우 → P(-1.96 ≤ Z ≤ 1.96) = 0.95, α = 0.05

	신뢰수준 Confidence Level	신뢰구간 Confidence Interval
	•구간에 모수가 포함될 확률 •어떠한 값이 알맞은 추정값 이라고 믿을 수 있는 정도 - α = 오차수준, 유의수준 - 100×(1-α) % = 신뢰수준	•신뢰수준 기준으로 추정 •통계적으로 유의미한 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법 {표본평균 - (z × SE)} ~ {표본평균 + (z × SE)}

[3] 가설검정

(1) 가설 (Hypothesis) | 모수에 대한 가정 or 잠정적인 결론

(2) 가설검정 (Statistical Hypothesis Test) | 대립가설을 채택할 수 있는지 평가하는 과정

(3) 가설검정의 오류 | 제 1종 오류/ 제 2종 오류

가설검정 오류
- 가설을 검증할 때
- 모집단이 아닌, 추출된 표본을 기반으로
- 모집단에 대한 결론을 내리는 것!
- 따라서 통계적인 오류 발생 가능성이 항상 존재한다...ㅜ
제 1종 오류: 귀무가설이 참인데, 기각하게 되는 오류 (H₀ T → F)
제 2종 오류: 귀무가설이 거짓인데, 채택하게 되는 오류 (H₀ F → T)
기각역: 대립가설이 맞을 때 그것을 받아들이는 확률

(4) 검정 통계량 | 모수를 추론하기 위해 사용하는 표본의 통계량

(5) p-value | 제 1종 오류를 범할 확률

참고 도서: 빅데이터분석기사 필기_수제비 2021

728x90

[빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 01. 분석 모형 설계 (2) (0)	2021.03.18
[빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 01. 분석 모형 설계 (1) (0)	2021.03.17
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 03. 통계기법 이해 (2) (0)	2021.03.17
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 03. 통계기법 이해 (1) (0)	2021.03.16
[빅데이터분석기사 필기 요약] II.빅데이터 탐색 - 02. 데이터 탐색 (2) (0)	2021.03.15

서윤로그