ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [빅데이터분석기사 필기 요약] I.빅데이터 분석 기획 - 01. 빅데이터의 이해 (3)
    Big Data/빅데이터분석기사-필기 2021. 3. 10. 20:30
    300x250
    반응형

    빅데이터분석기사 필기 요약

    🔑 인공지능/ 빅데이터/ 개인정보보호/ 개인정보 비식별화

     

     

    I. 빅데이터 분석 기획

       01. 빅데이터의 이해

          1. 빅데이터 개요 및 활용

          2. 빅데이터 기술 및 제도

          



     

    2. 빅데이터 기술 및 제도

     

    [2] 인공지능의 개념

     

    (1) 인공지능의 개념

    • 인공지능
      - 인간의 지적능력을 인공적으로 구현하여
      - 컴퓨터가 인간의 지능적인 행동, 사고를
      - 모방할 수 있도록 하는 소프트웨어
    • 인공지능 ⊃ 머신러닝 ⊃ 딥러닝

     

     

    (2) 빅데이터와 인공지능의 관계 ⇒ 상호보완 관계!

    • (인공지능의 분석력, 예측력) + (빅데이터의 신뢰성, 현실성) ⇒ 의미있는 결과 도출

    • 빅데이터로 말미암아 비정형 데이터 고속 분석이 가능해짐
      → 1950년대에 등장한 인공지능을 최신트렌드로 끌고 올 수 있게 됨
      → 자체 알고리즘으로 스스로 학습하는 딥러닝 기술
      → 특정 분야에서 인간의 지능을 뛰어넘는 능력!

    • 상호보완 관계
      - 빅데이터는 인공지능의 구현완성도 높여줌
      - 인공지능은 빅데이터의 문제해결 완성도를 높여줌

    • 빅데이터 기술이 주목받는 이유: 우수한 정보처리를 바탕으로 의미있는 결과를 도출!
    • 빅데이터와 인공지능의 목표가 부합 → 빅데이터는 인공지능을 위한 기술이 될 가능성이 크다!

     


     

    [3] 개인정보보호법·제도

     

    (1) 개인정보보호: 정보 주체(개인)의 개인정보 자기 결정권을 철저히 보장하는 활동

    • 개인정보 자기 결정권:
      자신에 관한 정보가 언제, 어떻게, 어느 범위까지 타인에게 전달 및 이용될 수 있는지를
      그 정보 주체가 스스로 결정할 수 있는 권리
    • 개인정보: 살아있는 개인에 관한 정보/ 개인을 알아볼 수 있는 정보

     

     

    (2) 개인정보보호의 필요성: 개인정보는 정보사회의 핵심 인프라

    • 유출 시 피해 심각함/ 정보사회 핵심 인프라/ 개인정보 자기 통제권

     

     

    (3) 빅데이터 개인정보보호 가이드라인

    • 개인정보 비식별화/ 재식별 시 즉시 조치/ 민감정보 처리 금지
    • 처리 사실, 목적 등을 공개해 투명성 확보/ 수집정보의 보호조치

     

     

    (4) 개인정보보호 관련 법령 (개망신법이 유명하다고 함..)

    • 인정보 보호법/ 정보통신법/ 용정보법
    • 위치정보법/ 개인정보의 안전성 확보조치 기준

     

     

    (5) 개인정보보호 내규 | 데이터 수집 시 개인정보보호를 위한 가이드라인

    • 정보보호 업무처리 지침/ 개발 보안 가이드/ 개인정보 암호화 매뉴얼
    • 소프트웨어 개발 보안 구조/ 기술적, 관리적 보호

     


     

    [4] 개인정보 활용

     

    (1) 개인정보 비식별화

    • 개인정보 일부/전부를 삭제/대체 → 다른 정보와 쉽게 결합해도 특정 개인을 식별할 수 없도록 하는 조치
    • 데이터값 삭제/ 가명처리/ 총계처리/ 범주화/ 데이터 마스킹 등

     

    (2) 개인정보 비식별화 절차 | 사전검토 → 비식별 조치 → 적정성 평가 → 사후관리

     

     

    (3) 개인정보 비식별 조치 방법 | 가명처리/ 총계처리/ 데이터삭제/ 범주화/ 마스킹

    • 가명처리: 식별할 수 없는 다른 값으로 대체
      - 휴리스틱 익명화/ 암호화/ 교환방법
      - (ex) 홍길동, 20대


    • 총계처리: 통곗값 적용
      - 총계처리 기본방식/ 부분집계/ 라운딩/ 데이터 재배열
      - (ex) 연구실 학생들 키 합: 650cm


    • 데이터 삭제: 특정 데이터값 삭제
      - 속성값 삭제/ 부분 삭제/ 준 식별자 제거를 통한 단순 익명화
      - (ex) 주민등록번호 → 90년대, 여성


    • 데이터 범주화: 범주화(해당 그룹의 대푯값으로 변환), 범위화(구간 값으로 변환)
      - 범주화 기본방식/ 랜덤 올림/ 범위 방법/ 세분 정보 제한 방법/ 제어 올림
      - (ex) 박씨, 20~30세


    • 데이터 마스킹: 전체 또는 부분적으로 대체값(공백, *, 노이즈)으로 변환
      - 임의 잡음 추가/ 공백과 대체 방법
      - (ex) 이OO, OO대학 재학

     

     

    (4) 재식별 가능성 모니터링

    • 정기적으로 모니터링 → 점검 항목 중 어느 하나에 해당하면 추가적인 비식별 조치 강구!
    • 내부 요인의 변화: 추가적인 정보 수집/ 이용과정에서 생긴 새로운 정보/ 신규 or 추가 구축되는 시스템 등
    • 외부 환경의 변화: 새로운 재식별 사례, 기술, 연계가능한 정보가 출현하거나 공개된 것으로 알려진 경우

     


     

    참고 도서: 빅데이터분석기사 필기_수제비 2021

     

    320x100
    반응형
Designed by Tistory.