-
[ADsP 요약] [ADsP 1과목] I. 데이터 이해 (2024 업데이트)자격증/데이터분석 준전문가 (ADsP) 2024. 5. 8. 20:53728x90반응형
데이터분석 준전문가 ADsP 1과목 요약
[1과목] 데이터 이해
I. 데이터의 이해
01. 데이터와 정보
02. 데이터베이스
II. 데이터의 가치와 미래
01. 빅데이터의 이해
02. 빅데이터의 가치와 미래
03. 가치 창조를 위한 데이터 사이언스와 전략 인사이트
I. 데이터 이해
01. 데이터와 정보 — 1. 데이터의 정의
[1] 데이터의 정의
(1) 데이터 정의
데이터의 정의 데이터와 정보 - 연구, 조사 등의 바탕이 되는 재료/자료 - 데이터는 있는 그대로의 객관적인 사실
- 가공되지 않은 자료- 기술적/사실적인 의미의 자료 - 정보는 데이터로부터 얻은 것
- 가공된 자료(2) 데이터 특성: 존재적, 당위적 특성
존재적 특성 당위적 특성 데이터는 있는 그대로의 객관적 사실 데이터는 추론, 예측, 전망, 추정을 위한 근거 예를 들어, X = 100, Y = 200 과 같은 사실 예를 들어, 평균값 = 150과 같이 가공된 자료
[2] 데이터의 유형 | 정성적 - 정량적 / 정형 - 비정형 - 반정형 / 암묵지 - 형식지
(1) 정성적 - 정량적
정성적 데이터 정량적 데이터 - 집합으로 표현할 수 없음 X
- 기준이 명확하지 않음 X- 집합으로 표현할 수 있음 O
- 기준이 명확한 데이터 O- 언어, 문자, 텍스트 등 - 수치, 도형, 기호 등 (2) 정형 - 반정형 - 비정형
정형 데이터 반정형 데이터 비정형 데이터 - 고정된 틀 O
- 연산 가능 O- 고정된 형태 O
- 연산 불가능 X- 고정된 형태 X
- 연산 불가능 X- 데이터 수집, 관리 용이함
- 관계형 DB에 저장
- CSV, 엑셀 스프레드시트 등- 테이블보다 파일 형태로 저장
- 가공을 거쳐 정형 데이터 변환 가능
- XML, JSON, 센서 데이터 등- 데이터 수집, 관리 어려움
- NoSQL DB에 저장
- 소셜 데이터, 댓글, 영상, 음성 등(3) 암묵지 - 형식지 상호작용
- 암묵지 (Tacit Knowledge): 학습과 체험을 통해 개인에게 습득되어 있음 / 겉으로 표출되지 않는 상태
- 형식지 (Explicit Knowledge): 암묵지가 문서, 매뉴얼처럼 외부로 표출됨 / 여러 사람들이 공유할 수 있음
- 암묵지와 형식지의 상호작용: 공통화, 표출화, 연결화, 내면화
암묵지 형식지 공통화 표출화 연결화 내면화 - 개인에게 습득
- 드러나지 않음- 표출, 공유
- 외부로 형상화- 암묵 → 암묵
- 대화, 상호작용- 암묵 → 형식
- 문서화, 매체화- 형식 + 형식
- 형식지의 상호결합- 형식 → 암묵
- 교육, 행동
01. 데이터와 정보 — 2. 데이터와 정보
[1] DIKW 피라미드 | 데이터 - 정보 - 지식 - 지혜
(1) 데이터에서 지혜까지 (DIKW)
데이터 Data 정보 Information 지식 Knowledge 지혜 Wisdom - 객관적 사실
- 의미가 중요하지 않음 X- 데이터의 가공, 처리
- 데이터간 연관관계, 의미도출
- 의미가 유용하지 않을수도!- 다양한 정보를 구조화
- 유의미한 정보를 분류
- 고유의 지식으로 내재화- 지식의 축적과 이해
- 지식 + 아이디어 결합
→ 창의적 산물제품X가 사이트A에서 10,000원 제품X는 사이트A보다
사이트B에서 더 비싸게 판매함사이트A에서 더 싸므로
제품X를 구매할 계획임사이트B의 타제품도 사이트A
보다 더 비쌀 것으로 예측됨(2) 데이터 단위
- KB 킬로 < MB 메가 < GB 기가 < TB 테라 < PB 페타 < EB 엑사 < ZB 제타 < YB 요타
비트 bit 바이트 byte 테라바이트 TB 데이터 단위 비교 0, 1 의 두가지 값으로
신호를 나타태는 최소단위- 1 byte = 8 bit
- 데이터 양을 나타내는 단위- 1 TB = 1024 GB
- 1 TB = 10^12 byteK - M - G - T - P - E - Z - Y
(페타 < 엑사 < 제타 < 요타)
02. 데이터베이스 — 1. 데이터베이스 개요
[1] 데이터베이스 정의
(1) 데이터베이스의 다양한 정의
- 데이터베이스란?
우리나라 저작권법 정보통신용어사전 위키피디아 한국데이터산업진흥원 데이터베이스란,
체계적이거나 조직적으로
정리되고 전자식 또는 기타수단
으로 개별적으로 접근할 수 있는
독립된 저작물, 데이터 또는
기타소재의 수집물이다.데이터베이스란, 동시에 복수의
적용업무를 지원할 수 있도록
복수 이용자의 요구에 대응해서
데이터를 받아들이고, 저장, 공급
하기 위해 일정한 구조에 따라
편성된 데이터의 집합이다.- 데이터베이스란, 체계적으로
정렬된 데이터 집합
- 데이터 양, 이용이 늘어나면서,
대용량의 데이터를 저장, 관리,
이용할 수 있는 컴퓨터 기반의
데이터베이스로 진화하였다.데이터베이스란, 상호관련된
다수의 콘텐츠를 정보처리 및
정보통신기기에 의하여
체계적으로 수집, 축적하여
다양한 용도와 방법으로
이용할 수 있게 정리한
정보의 집합체를 의미한다.- 데이터베이스 DB, 데이터베이스 관리 시스템 DBMS
DB (Data-Base) DBMS (Data-Base Management System) 체계적으로 수집, 축적하여 다양한 용도, 방법으로
이용할 수 있도록 정리한 정보의 집합체이용자가 쉽게 데이터베이스를
구축, 유지할 수 있게 하는 관리 소프트웨어
[2] 데이터베이스의 특징
(1) 데이터베이스의 일반적인 특징 | 통합, 저장, 공용, 변화
통합된 데이터
Integrated data저장된 데이터
Stored data공용 데이터
Shared data변화하는 데이터
Operaional data동일한 내용의 데이터가
중복되지 않게 통합되어 있다.컴퓨터가 접근할 수 있는
저장매체에 저장되어 있다.- 여러 사용자가 다른 목적으로
데이터를 공유할 수 있다.
- 대용량화 & 복잡한 구조삽입, 수정, 삭제, 갱신을 통해
항상 현재의 정확한 데이터를
유지해야 한다.(2) 다양한 측면에서의 특성 | 정보축적 및 전달, 정보이용, 정보관리, 정보기술발전, 경제 및 산업적 측면
정보축적 및 전달 측면 정보이용 측면 정보관리 측면 정보기술발전 측면 경제 및 산업적 측면 - 기계 가독성
- 검색 가능성
- 원격 조작성이용자의 요구에 따라
다양한 정보를
신속, 정확, 경제적 획득일정한 질서, 구조에 따라 정리, 저장, 검색, 관리할 수 있게 체계적으로 축적 관련 소프트웨어,하드
웨어, 네트워크 기술 등의 발전을 견인 가능다양한 정보를 필요에
따라 신속하게 제공,이용가능한 인프라의 특성(3) 데이터베이스 트랜잭션 특성 | ACID - 원자성, 일관성, 고립성, 지속성
- 트랜잭션 (Transaction): 데이터베이스에서 명령을 수행하는 하나의 논리적인 기능의 단위
원자성 Atomicity 일관성 Consistency 고립성 Isolation 지속성 Durability 트랜잭션은 데이터베이스에
모두 적용되거나,
모두 적용되지 않아야 함트랜잭션의 결과는
항상 일관적이어야 함
(완료하면 항상 유지)다른 트랜잭션에
영향을 주지 않아야 함
(중간 과정에 개입 불가)트랜잭션이 완료되면
그 결과는 영구적이어야함
(영원히 반영되어야 함)
02. 데이터베이스 — 2. 데이터베이스 활용
[1] 데이터베이스 활용
(1) 기업 내부의 데이터베이스 | OLTP, OLAP, EAI, KMS, SCM, ERP, CRM, BI, RTE
OLTP OLAP EAI KMS 각각의 거래단위/트랜잭션에
초점을 맞춘 시스템쌓인 전체 데이터의
분석에 초점을 맞춤모든 서비스를 중앙에서
관리하여 애플리케이션 통합지식 경영 시스템 1990년대 중반 이전
기업 활동 영역별로 구축되던
단순 자동화 중심 시스템단순한 정보 수집, 공유에서
분석 중심 시스템 구축으로 변화한 기업내 여러 서비스간
연계를 위해, 중앙에서 관리해
연결루트를 간소화함과거/외부사례, 직원 역량 등
모든 지식을 통합하여
문제 해결 능력을
향상시키는 것이 목적SCM ERP CRM BI RTE 공급사슬 관리
= 공급망 관리모든 비즈니스 단계를
하나의 시스템으로 통합고객 관계 관리,
고객과의 상호작용 관리비즈니스 인텔리전스
=기업 의사결정 프로세스실시간 기업 경영,
스피드 경영원자재 공급단계부터
고객에게 도달할 때까지
유통단계를 최적화여러 자원, 업무를
하나의 시스템으로
통합하여, 업무 효율성을 높이는 것이 목적기업 내외부 분석을 통해
마케팅 측면에서
신규고객 창출 또는
기존고객 이탈 방지산재된 데이터를 수집,
분석해, 필요한 정보를
정확한 시간에 제공하여
의사결정에 도움업무 프로세스에서
발생하는 정보를
실시간 통합, 전달해
신속한 대응 가능(2) 산업 부문별 데이터베이스 발전과정
제조 부문 금융 부문 유통 부문 - 가장 중요한 DB 적용분야
- 2000년대 이후 본격 확대되었으며
실시간RTE가 대표적 화두였음
→ 최근은 내부 인하우스 DB구축이 주류IMF 이후 금융 업무 프로세스 효율화와
통합시스템 구축이 크게 확산됨
→ 2000년대 중반이후 DW 적극 도입
* DW: Data Warehouse2000년대 이후 IT변화에 따라 CRM, SCM 본격화
→ 2000년대 중반 이후 고객정보 수집/분석 심화
→ 최근 RFID(전자태그) 등장으로
대용량 DB플랫폼 요구되는 상황(3) 사회기반구조로서의 데이터베이스
- 지리, 교통 부문의 데이터베이스는 고도화
- 의료, 교육, 행정 등 사회 각 부문으로 공공 DB의 구축, 이용이 확대됨
물류 부문 지리 부문 교통 부문 의료 부문 교육 부문 - 실시간 차량 추적
- 물류정보 DB 서비스
- CVO, CALS
- 항만, 철도- GIS 지리정보시스템
- LBS 위치정보시스템
- 공간정보 관리시스템- 지능형교통정보시스템
- 교통정보
- 기초자료 및 통계제공- 의료정보시스템
- U-Health 실현
- PACS- 교육정보 개발, 보급
- 대학 정보화
- 교육행정 정보화
- NEIS
[2] 데이터베이스 종류
(1) 데이터베이스 종류 | RDBMS, NoSQL
RDBMS (관계형 데이터베이스)
테이블/ 정형/ 객체지향NoSQL (Non SQL, Non-relational)
비관계형/ 비정형/ 분산처리- 행, 열로 이루어진 테이블에 데이터를 저장함 - 기존 RDB의 SQL을 보완, 개선한 비관계형 데이터베이스 - 데이터 저장방식은 엑셀파일과 비슷함 - 대용량 데이터 분석, 분산처리에 용이함 - 정형 데이터에 특화됨 - 비정형 데이터에 특화됨 - 객체 관계형 DB: Oracle, DB2, Informix,
- MySQL, MS-SQL, MariaDB
- Derby, SQLite- Document-Oriented DB: MongoDB, ElasticSearch, ...
- Key-Value DB: Dynamo, Redis, SimpleDB, ...
- Column-Oriented DB: Bigtable, Cassandra, HBase, ...계층형 DBMS 네트워크형 DBMS 분산형 DBMS 객체지향 DBMS - 데이터간 부모-자식관계 이룸
- 단점: 중복문제 생기기 쉬움- 데이터간 그물형태로 연결
- 단점: 복잡해서 변경 어려움분산된 여러개 DB를 하나로
인식하고 사용 가능한 시스템- 유저가 정의한 타입을 하나의
데이터 유형으로 저장해줌
- 유저가 원하는 형태로 표현가능- 데이터베이스 구성요소
인스턴스 속성 엔터티 메타데이터 인덱스 하나의 객체 객체를 표현하기 위해
사용되는 값데이터의 집합
(개념적 존재)데이터를
설명하는 데이터자동적으로 생성되는
데이터의 이름사람, 동물, 물건 등 이름, 성별, 직업 등 개념, 장소, 사건 등 파일 생성 날짜 등 정렬, 탐색을 위한 색인 (3) SQL (Structured Query Language)
- SQL: DBMS에서 데이터베이스에 명령을 내리는 하부언어
- SQL 언어: DDL, DML, DCL, TCL
DDL DML DCL TCL 데이터 정의 언어 데이터 조작 언어 데이터 제어 언어 트랜잭션 제어 언어 - CREATE: 테이블 생성
- ALTER: 테이블 정보 변경
- RENAME: 테이블 이름 변경
- DROP: 테이블 삭제- SELECT: 데이터 조회
- INSERT: 데이터 삽입
- UPDATE: 데이터 변경
- DELETE: 데이터 삭제- GRANT: 권한 부여
- REVOKE: 권한 회수- COMMIT: 변경 일괄 적용
- SAVEPOINT: 현재 상태 기억
- ROLLBACK: 특정 시점으로
II. 데이터의 가치와 미래
01. 빅데이터의 이해 — 1. 빅데이터의 이해
[1] 빅데이터의 이해(1) 빅데이터 정의
- 빅 Big = 양적으로 많음 + 질적으로 다양하고 복잡함
- 큰 용량과 복잡성으로, 기존 애플리케이션이나 툴로는 다루기 어려운 데이터셋 집합
(2) 빅데이터 특징 | 3V, 4V
- 3V = Volume + Variety + Velocity (3V에 Value, Veracity 등을 더해 4V로 표현하곤 한다)
Volume Variety Velocity Value Veracity 정보량/규모의
기하급수적 증가데이터 유형 다양화
(정형, 반정형, 비정형)데이터 생성, 처리
속도 증가 (가속화)데이터 전체 파악,
패턴 발견이 어려워짐분석 결과에 대한 신뢰성,
정확성이 중요해짐
01. 빅데이터의 이해 — 2. 빅데이터 출현배경
[1] 빅데이터의 출현 배경- 고객 데이터 축적 및 활용 증가, 인터넷 확산, 무선통신5G 발전, 모바일 생태계 확산, 스마트폰 보급 확대, 저장기술 발전,
메모리 가격 하락, 클라우트 컴퓨팅 기술 발전, SNS 확대, IoT 증가, 데이터분석 툴의 발전
데이터의 양적 증가 관련 기술 발전 산업계 변화 학계 변화 - 과학기술 발달
- 컴퓨터, 스마트폰 보급
- 기술의 패러다임 시프트- 저장기술 발전
- 인터넷, 모바일 발전
- 클라우드컴퓨팅→처리비용↓- 양질 전환의 법칙
- 거대한 데이터가 새로운
기술을 만나 새로운 가치 창출- 기술아키텍처, 통계도구 발전
- 게놈 프로젝트
- 기후 시뮬레이션 등[2] 빅데이터의 기능과 변화
(1) 빅데이터의 기능
- 산업 전반의 생산성을 획기적으로 끌어올릴 것
- 새로운 범주의 산업을 만들어낼 것
- 빅데이터는 플랫폼으로서 다양한 서드파티 비즈니스에 활용될 것으로 기대됨
플랫폼: 공동 활용을 목적으로 구축된 유무형의 구조물
(2) 빅데이터에 의한 변화
사전처리 → 사후처리 표본조사 → 전수조사 질 → 양 인과관계 → 상관관계 기술과 인재, 조직 변화 가능한 많은
데이터를 모으고,
다양하게 조합하여
숨은 인사이트를 발굴함IoT, 클라우드 기술의
발전으로 데이터
처리비용이 감소하면서
활용방법이 변화함수집 데이터의 양이
증가할수록, 분석 결과
정확도가 높아져서
긍정적인 영향을 줌데이터양이 급증하면서
상관관계를 통해 특정
현상의 발생가능성을
포착, 행동을 추천함데이터, 기술의 변화
→ 인재가 요구됨
→ 데이터중심 조직등장
02. 데이터의 가치와 미래 — 1. 빅데이터의 가치와 영향
[1] 빅데이터의 가치(1) 빅데이터의 가치
- 빅데이터의 가치는 어떤 인사이트를 발굴하여 어떻게 활용할 것인지에 달림
- 중요한 것은 빅데이터를 통한 인사이트를 가치있게 만드는 과정 그 자체!
- 빅데이터가 가치를 만들어내는 5가지 방식 (맥킨지, 2011)
- 투명성 제고 → 연구개발, 관리효율성 제고
- 시뮬레이션을 통한 수요포착, 주요변수탐색 → 경쟁력 강화
- 고객 세분화, 맞춤 서비스 제공
- 알고리즘을 활용한 의사결정 보조 or 대체
- 비즈니스 모델, 제품, 서비스의 혁신 - 빅데이터 가치 산정의 어려움
데이터 활용방식의 변화 가치 창출 방식의 변화 분석 기술의 발전 빅데이터 재사용, 재조합, 다목적 개발
→ 특정 데이터를 누가, 언제, 어떻게,
어디서 활용하는지 알 수 없게 됨빅데이터가 기존에 없던
새로운 가치를 창출함
→ 가치를 산정하기 어려움데이터 분석 기술의 발전
→ 가치있는 데이터와 가치없는 데이터의
경계를 나누기 어려워짐(2) 빅데이터의 영향
기업 정부 개인 - 소비자 행동 분석, 시장 변동 예측
- 비즈니스 모델 혁신, 신사업 발굴- 환경 탐색, 상황 분석
- 미래 대응- 개인의 목적에 따른 활용
- 스마트 라이프로 변화
02. 데이터의 가치와 미래 — 2. 빅데이터 비즈니스 모델
[1] 빅데이터 활용 사례(1) 빅데이터 활용
- 사례: 기업 - 구글, 월마트 / 정부 - 교통, 기후, 지질, 안전 등 / 개인 - 정치인, 연예인 SNS 등
(2) 미래의 빅데이터 활용에 필요한 3요소 | 데이터, 기술, 인력
데이터 기술 인력 모든 것의 데이터화 진화하는 알고리즘과 인공지능 데이터 사이언티스트,
알고리즈미스트(3) 7가지 빅데이터활용 기본테크닉
- 연관규칙 학습, 유형분석, 유전 알고리즘, 기계학습 = 머신러닝
연관규칙 학습
= 연관분석, 장바구니 분석유형분석
분류 & 군집화유전 알고리즘
Genetic algorithms기계학습 = 머신러닝
Machine learning어떤 변인간에 주목할만한
상관관계가 있는지 분석새로운 사건이 속할
범주를 찾아내는 방법자연선택, 돌연변이 등을 통해
점진적으로 진화시킴훈련 데이터로부터 학습한,
알려진 특성을 통해 예측A를 구매한 사람이
B를 더 많이 구매하는가?온라인 수강생들의 특성을
반영 → 어떻게 분류할 것인가?- 최적화 문제
- 배치 효율화 문제영화 추천 시스템, 스팸메일
필터링, 질병진단 예측- 회귀분석, 감성분석, 소셜 네트워크 분석
회귀분석
Regression analysis감성분석
Sentiment analysis소셜 네트워크 분석
SNA (Social Network Analysis)독립변수를 조작하면서
종속변수가 어떻게 변화하는지 분석
→ 두 변인의 관계를 파악특정 주제에 대해 말한/서술한
사람의 감성을 분석하는 방법
→ 비정형/텍스트마이닝 → 긍부정 선별SNS와 같은 온라인 공간에서 영향력 있는
사람(오피니언 리더)을 찾아내고,
고객 간 소셜 관계를 파악함사용자의 만족도가 브랜드 충성도에
어떤 영향을 미치는가?호텔을 이용한 고객의 후기(리뷰)를
분석하여 고객의 니즈를 찾아냄- 특정인과 타인의 관계가 몇 촌인가?
- 특정인이 어느 정도 영향력이 있는가?
02. 데이터의 가치와 미래 — 3. 빅데이터의 위기요인과 통제방안
[1] 빅데이터 위기요인과 통제방안위기요인 → 통제방안 사생활 침해 → 개인정보 사용자의 책임으로 해결 (동의에서 책임으로) 책임 원칙 훼손 → 결과기반 책임원칙 고수 (미리 예측말고 이미 일어난 결과) 데이터 오용 → 알고리즘 접근 허용 (알고리즈미스트) [2] 개인정보 비식별 기술
- 개인정보 비식별 기술: 데이터 속에서 특정한 개인을 식별할 수 있는 요인을 숨김 → 식별 불가능하도록 함
가명처리 데이터 마스킹 총계 처리 데이터값 삭제 데이터 범주화 다른값으로 대체 임의의 값으로 대체 통곗값(총합,평균) 적용 데이터값의 일부 삭제 특정값이 아닌 범위 ex) 홍길동, 25세
→ 김가명, 20대ex) 홍길동, 한국대학교
→ 홍OO, OO대학교ex) 김-50kg, 이-60kg
→ 몸무게합=110kgex) 901212-2000000
→ 90년대생, 여성ex) 홍길동, 55세
→ 홍씨, 50-60세
03. 가치창조를 위한 데이터 사이언스와 전략 인사이트
1. 빅데이터의 분석과 전략 인사이트
[1] 빅데이터 열풍과 회의론- 많은 양의 데이터가 반드시 새로운 가치로 연결되지는 않음..
- 데이터에 기초한 "의사결정"이 중요함
- 빅데이터 회의론: 부정적 학습효과, 과대 포장 때문
[2] 빅데이터 분석의 핵심은 인사이트
- 데이터로부터 어떤 시각, 인사이트를 얻을 수 있는가
- 데이터의 양이 아니라, 가치를 뽑아내는 것이 빅데이터의 핵심!
- 비즈니스의 핵심가치에 집중, 분석 평가지표 개발
- 시장, 고객 변화에 효과적으로 대응할 수 있어야 함
- 걸림돌은 비용이 아니라, 분석적 방법과 성과에 대한 이해 부족!
- 전략적 인사이트의 중요성
- 전략적인 인사이트를 가지고,
- 핵심적인 비즈니스에 집중하여 데이터를 분석하고
- 차별적인 전략으로 기업을 운영해야 함
[3] 일차원적 분석 vs. 가치기반 분석
(1) 산업별 일차원적 분석
금융 서비스 에너지 병원 정보 - 신용점수 산정
- 사기 탐지, 가격 책정
- 프로그램 트레이딩
- 클레임, 고객수익성 분석- 트레이딩
- 공급, 수요 예측- 가격 책정
- 고객 로열티
- 수익 관리- 사기 탐지
- 사례 관리
- 범죄 방지
- 수익 최적화(2) 전략도출을 위한 가치기반 분석
- 일차원적 분석: 업계 내부 문제에만 초점, 주로 부서 단위로 관리
- 분석 활용범위를 더 넓고, 전략적으로 변화 → 사업, 트렌드에 대한 큰 그림 → 가치기반 분석단계로!
- 가치기반 분석: 사업 성과를 이끄는 요소들, 차별화 기회에 중요한 인사이트를 줄 것!
2. 전략 인사이트 도출을 위해 필요한 역량
[1] 데이터 사이언스- 통계학: 정형화된 실험 데이터를 분석함 ↔ 데이터 사이언스: 다양한 유형을 대상으로 함
- 데이터 마이닝: 주로 분석에 초점을 맞춤 ↔ 데이터 사이언스: 분석뿐 아니라, 구현, 전달까지 모두 포괄함
(1) 데이터 사이언스 | 데이터로부터 의미있는 정보를 추출해내는 학문
- 정형, 비정형을 막론하고 다양한 유형의 데이터를 분석함
- 데이터 분석, 구현, 전달, 궁극적으로는 전략적 인사이트 도출을 위한 일련의 행위까지 포괄하는 광의의 개념
- 전략적 통찰을 추구하고, 비즈니스 핵심이슈에 답하고, 사업성과를 이끌 수 있음
(2) 데이터 사이언스 구성요소 | Analytics + IT + 비즈니스 분석
Analytics IT (Data Management) 비즈니스 분석 - 수학, 확률모델, 머신러닝, 분석학
- 패턴 인식과 학습
- 불확실성 모델링 등- 시그널 프로세싱, 프로그래밍
- 데이터 엔지니어링, 데이터 웨어하우징
- 고성능 컴퓨팅 등- 커뮤니케이션
- 프레젠테이션
- 스토리텔링, 시각화 등(3) 과학과 인문학의 교차로 | 소프트 스킬은 인문학에서 나온다!
- 정량분석이라는 과학 + 인문학적 통찰에 근거한 합리적 추론
외부 환경 변화 컨버전스 → 디버전스 단순 세계화 → 복잡 세계화 생산 → 서비스 제품 생산 → 서비스 생산 → 시장창조 기술 경쟁 → 무형 자산의 경쟁 [2] 데이터 사이언티스트
(1) 데이터 사이언티스트에게 요구되는 역량 | 하드 스킬 + 소프트 스킬
- 가트너가 제시한 역량: 데이터 관리, 분석 모델링, 비즈니스 분석, 소프트 스킬
하드 스킬 Hard Skill : 지식, 숙련 소프트 스킬 Soft Skill: 통찰, 전달, 협력 - 빅데이터에 대한 이론적 지식: 방법론 이해, 습득
- 분석기술에 대한 숙련: 최적 분석 설계, 노하우 축적- 통찰력 있는 분석: 창의적 사고, 호기심, 논리적 비판
- 설득력 있는 전달: 스토리텔링, 시각화
- 다분야 간의 협력: 커뮤니케이션 (소통 능력)
3. 빅데이터 그리고 데이터 사이언스의 미래
[1] 가치 패러다임의 변화- 패러다임: 한 시대 사람들의 견해, 사고를 근본적으로 규정하고 있는 프레임으로서의 인식의 체계
또는 사물에 대한 이론적인 틀이나 체계를 의미함 - 패러다임 시프트: 시간의 흐름에 따라 다음 세대의 패러다임으로 변화
- 가치 패러다임: 경제와 산업의 원천에 있는 가치에 대한 패러다임
- 가치 패러다임의 변화: 디지털화 → 연결 → 에이전시
과거 - 디지털화 Digitalization 현재 - 연결 Connection 미래 - 에이전시 Agency 아날로그 세상을 어떻게
효과적으로 디지털화하는가
(ex) 오피스 프로그램 등- 디지털화된 정보, 대상들이 서로 연결
- 이 연결이 얼마나 효과적으로 제공되는가
(ex) 구글 검색 알고리즘 등많고 복잡한 연결을 얼마나 효과적이고
신뢰할 수 있도록 관리하는가[2] 데이터 사이언스의 한계
데이터 사이언스의 한계 데이터 사이언티스트에게 요구되는 인문학 - 모든 분석은 가정에 근거함
- 가정이 변하지 않아도, 실제 외부 요인은 계속 변화함
- 따라서 데이터 분석은 100% 완벽할 수 없다!- 모델의 능력에 대해 항상 의구심을 가져야 함
- 가정과 현실의 불일치, 현실세계의 변화를 주시해야 함
참고도서: ADsP 데이터분석 준전문가_위키북스 2021, 2024
728x90반응형'자격증 > 데이터분석 준전문가 (ADsP)' 카테고리의 다른 글
[ADsP 요약] [ADsP 2과목] II. 데이터 분석 기획 (2024 업데이트) (1) 2024.05.11 [ADsP 요약] [ADsP 3과목] III. 데이터 분석 (1) (0) 2021.05.17 [ADsP] [데이터분석 준전문가] 국가공인 데이터분석 준전문가 시험과목 및 내용 (0) 2021.04.22