ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (9) 딥러닝 분석
    자격증/빅데이터분석기사-필기 2021. 3. 25. 22:53
    728x90
    반응형

    빅데이터분석기사 필기 요약

    🔑 딥러닝/ DNN/ 은닉층/ 역전파/ CNN/ 컨볼루션/ 피처맵/ 서브샘플링/ RNN

     

    III. 빅데이터 모델링

       02. 분석기법 적용

          1. 분석기법

          2. 고급 분석기법

     



     

    2. 고급 분석기법

     

    [5] 딥러닝 분석

     

    (1) 딥러닝

    • 딥러닝 ⊂ 머신러닝 ⊂ 인공지능

    • 딥러닝 (Deep Learning)
      - 여러 비선형 변환기법의 조합을 통해
      - 높은 수준의 추상화를 시도하는
      - 기계학습 알고리즘의 집합

      - 추상화(Abstraction): 많고 복잡한 데이터를 핵심 요약!

    • 딥러닝 부각이유
      - 기울기 소실 해결: 기존 인공신경망 모델의 문제점이었음
      - 분석 시간의 단축: 강력한 GPU를 연산에 활용함 → 하드웨어 연산속도↑
      - 데이터 확보 가능: 빅데이터 등장 & SNS 활용↑

     

     


     

    (2) 딥러닝 알고리즘 | DNN/ CNN/ RNN/ GAN ...

    DNN 알고리즘
    Deep Neural Network
    CNN 알고리즘
    Convolution Neural Network
    RNN 알고리즘
    Recurrent Neural Network
    < 은닉층 여러 개 >
    역전파 알고리즘
    가중치 적용 반복
    < 필터 = 컨볼루션 = 합성곱 >
    피처맵 (2차원 이미지 맵)
    합성곱(컨볼루션)과 서브샘플링 반복
    < 재귀적 구조의 은닉층 >
    순차, 연속적인 데이터
    장기 의존성 문제/ 가중치 업데이트

     

    • DNN (Deep Neural Network): 은닉층을 심층 구성한 신경망
      • 입력층, 여러 개의 은닉층(Hidden Layer), 출력층으로 이루어진 인공신경망(ANN)
        - 입력층: 가중치를 곱하고, 은닉층으로 이동
        - 은닉층: 가중치를 곱하면서 다음 계층으로 이동

      • 역전파 알고리즘: 출력층, 은닉층, 입력층 순서로 역방향 수행 반복 → 최적화된 결과 도출
        - 일반적인 인공신경망과 마찬가지로, 복잡한 비선형 관계들을 모델링할 수 있음
        - 여러 은닉층을 통해, 더 적은 수의 유닛으로도 복잡한 데이터를 모델링할 수 있게 해줌

     

    • CNN (Convolutional Neural Network) (합성곱 신경망): 필터 기능과 신경망을 결합

      - 필터 기능(Convolution): 기존 영상처리의 필터 기능을 의미함
      - 필터 기능을 통해 입력이미지에서 특징 추출 → 다층 신경망을 통해 분류 수행
      - 여러 개의 컨볼루션 층(합성곱 층) & 서브샘플링 층(풀링 층)으로 이루어진 인공신경망

      • 입력층 합성곱 연산: 필터로 입력이미지에서 특징(피처) 추출 → 피처맵 구성
        - 피처맵(Feature Map): 이미지 추출 시, 환경변화에 잘 적응하는 강인한 특징을 유도한 2차원 맵
          (환경변화란 왜곡, 변형 등을 의미함)

      • 피처맵에서 서브샘플링 연산: 피처맵에서 서브샘플링 연산 → 화면 크기 축소
        - 서브샘플링 층(Subsampling): 만들어진 피처맵에 대해 공간적 해상도를 줄인 뉴런층
        - 서브샘플링을 통해, 차원 축소 → 문제 복잡도 축소

        - 연산자: 최대 풀링(Max Pooling)/ 최소 풀링(Min Pooling)/ 평균 풀링(Average Pooling) 등
        - 최대 풀링은 최댓값/ 최소 풀링은 최솟값/ 평균 풀링은 평균값을 취함
        - 풀링을 통해서 차원 축소 뿐만 아니라, 피처맵이 이동이나 왜곡에 대해 강인해지도록 할 수 있음

      • 피처맵에서 합성곱&서브샘플링 반복연산: 반복하여 최적화된 피처맵 구성
      • 완전연결계층에서 다층신경망으로 분류수행: 완전연결계층 → 1차원 행렬 매핑 → 확률로 분류
        - 완전연결계층(Fully Connected Layers)의 다층 신경망에 피처맵을 입력
        - 2차원 이미지를 1차원 행렬로 변환 → 신경망 입력에 하나씩 매핑(Mapping)
        - 분류: Softmax 함수를 이용하여, 결과를 확률로 분류(Classification)

     

    • RNN (Recurrent Neural Network) (순환 신경망): 은닉층에서 재귀적인 신경망을 가짐
      • 입력층, 은닉층, 출력층으로 구성/ 은닉층에서 재귀적인 신경망을 가지는 알고리즘
        - 유닛간 연결이 순환적인 구조를 가짐
        - 입력받는 신호의 길이가 한정되지 않는, 동적인 데이터를 처리함

      • 음성 신호, 연속적 시계열 데이터 등의 순차적인 데이터 분석에 적합
        - 시퀀스 형태의 입력을 처리할 수 있음
        - 필기체 인식 분야에서도 활용됨

      • 문제점: 장기 의존성 문제/ 기울기 소실 문제
        - 장기 의존성 문제(Long-Term Dependency):
          현재 노드와 거리가 먼 과거 상태를 사용한 문맥처리가 어려운 문제

      • 확률적 경사 하강법/ 시간 기반 오차 역전파를 사용 → 가중치 업데이트
        - 확률적 경사 하강법(SGD): 손실함수의 기울기 계산 → 조금씩 아래로!
           → 손실함수 최소 지점에 도달하도록 하는 알고리즘
        - 시간 기반 오차 역전파: 역전파 알고리즘(Back Propagation)을 통해 비용의 기울기를 찾는다~

     


     

    참고 도서: 빅데이터분석기사 필기_수제비 2021

     

    728x90
    반응형