-
[빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (8) 베이지안 기법자격증/빅데이터분석기사-필기 2021. 3. 25. 20:16728x90반응형
빅데이터분석기사 필기 요약
🔑 확률/ 교사건/ 표본 평균/ 표본 분산/ 표본 표준편차/ 표본 공분산/ 상관계수/ 상관계수 행렬/
조건부확률/ 전확률의정리/ 베이즈정리/ 베이즈확률III. 빅데이터 모델링
02. 분석기법 적용
1. 분석기법
2. 고급 분석기법
2. 고급 분석기법
[4] 베이지안 기법
(1) 확률 및 기본 통계이론
- 확률 (Probability)
- 비슷한 현상이 반복해서 일어날 경우,
- 어떤 사건이 발생할 가능성을
- 숫자로 표현하는 방법
- 같은 원인에서 특정한 결과가 나타나는 비율 - 교사건 (Intersection of Events):
- P(A⋂B) = 사건 A, B에 동시에 속하는 기본 결과들의 모임
S : 표본공간 표본 공간/ 전체 개수 A : 사건(Event) 관심 있는 부분의 개수 P(A) = A / S
P(B) = B / S(관심사건 / 전체) % P(A⋂B) : 교사건 관심사건 두 개가 동시에 속하는 확률
- 통계 파라미터: 표본 평균/ 표본 분산/ 표본 표준편차/ 표본 공분산/ 상관계수/ 상관계수 행렬
- 표본 공분산 (Sample Covariance)
- 2개 이상의 변량 데이터가 주어질 경우, 각 변량간의 변화하는 양상을 나타내는 통계적 척도
- 2가지 변수(x, y)가 변하는 정도를 수로 나타냄
- 한 변수가 변할 때 다른 변수가 변하는 정도/ 두 변수가 동시에 변하는 정도 - 변량 (Variance): 조사내용으로서의 특성을 수량으로 나타낸 값 (연속 변량, 이산 변량)
- 표본 공분산 (Sample Covariance)
표본 평균 표본 분산 표본 표준편차 표본 공분산 상관계수 상관계수 행렬 (총합) / (개수)
무게중심평균값의 차이에
대한 제곱의 평균
흩어진 정도분산의 제곱근
(단위 일치시킴)각 변량간의
변화하는 양상두 변량간의
상관관계
(0 ≤ |ρ| ≤ 1)각 변량간의
상관계수를
행렬로 나타낸 값
(2) 조건부 확률 | 어떤 사건이 일어난다는 조건에서 다른 사건이 일어날 확률
- 조건부 확률 (Conditional Probability)
- 2개의 사건 A, B에 대하여,
- 사건 A가 일어난다는 선행조건 하에
- 사건 B가 일어날 확률 - A → B 조건부 확률 P(B|A) = P(A⋂B) / P(A), P(A) ≠ 0
- B → A 조건부 확률 P(A|B) = P(A⋂B) / P(B), P(B) ≠ 0
(3) 전 확률의 정리 | 사건의 원인을 나눔 → 원인이 되는 확률의 가중합으로 사건의 확률을 구함
- 전 확률의 정리 (Law of Total Probability)
- 나중에 주어지는 사건 A의 확률을 구할 때,
- 사건 A의 원인을 여러가지로 나누어서
- 각 원인에 대한 조건부 확률P(A|Bi)과
- 그 원인이 되는 확률P(Bi)의 곱에 의한
- 가중합으로 구할 수 있다! - 전 확률의 정리 공식
P(A) = P(B1 ⋂ A) + P(B2 ⋂ A) + ... + P(Bn ⋂ A)
= P(B1) P(A|B1) + P(B2) P(A|B2) + ... +P(Bn) P(A|Bn)
= ∑ P(Bi) P(A|Bi)
(4) 베이즈 정리
- 베이즈 정리 (Bayes' Theorem)
- 어떤 사건에 대해 관측 전 원인에 대한 가능성과 관측 후 원인 가능성 사이의 관계를 설명
- 두 확률변수의 사전확률과 사후확률 사이의 관계를 설명하는 확률이론 - 베이즈 확률
- 어떤 사건 B가
- 서로 배반인 A1, A2, ... , An 중에서
- 어느 한 가지 경우로 발생하는 경우,
- 실제 B가 발생할 때, 이것이 Ai일 확률 - P(Ai|B)
- B를 표본공간S 내 임의의 사상(집합)이라고 하고,
- 서로 배반인 사상 A1, A2, ... , An 의 합 사상 = 표본공간S라고 하면,
- B사건을 근거로 Ai사건이 발생할 확률
참고 도서: 빅데이터분석기사 필기_수제비 2021
728x90반응형'자격증 > 빅데이터분석기사-필기' 카테고리의 다른 글
[빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (10) 비정형 데이터 분석 (0) 2021.03.26 [빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (9) 딥러닝 분석 (0) 2021.03.25 [빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (7) 시계열 분석 (0) 2021.03.25 [빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (6) 범주형 자료 분석 (0) 2021.03.24 [빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (5) 군집분석 (0) 2021.03.23 - 확률 (Probability)