데이터 분석 유형(descriptive, predictive)
1. 데이터 분석 유형
데이터 분석은 의사결정에 유용한 정보나 지식을 추출하기 위해 데이터로부터 사실이나 관계, 패턴 등을 발견하는 과정을 말한다. 현재상황 사실파악, 현재 상황의 원인파악, 미래나 결과 예측, 해결방안 도출 등의 유형으로 나눌 수 있으며 빅데이터에서 주로 쓰이는 대표적 유형으로 Descriptive Analysis와 예측분석(Predictive Analysis)로 나눠볼 수 있다.
1) descriptive 유형
descriptive 유형은 데이터를 요약해서 정보를 생성하며 이를 바탕으로 사실을 이해하고 현황을 파악하고 결과적으로 의사결정의 질을 높여준다. 현재 데이터를 요약해서 현황을 파악해주는 기법이며 더 나은 의사결정을 할 수 있도록 도움이 되는 정보들을 제공한다. 결과적으로 의사결정의 질을 높일 수 있다. descriptive 유형은 세가지로 크게 나눌 수 있는데 기술통계, 군집화, 연관이다. 기술통계는 통계분석에 기반하여 데이터 속성을 요약하며 그래프를 통해 쉽게 전체적인 내용을 시각적으로 파악할 수 있다. 두번째 군집화는 유사한 속성을 갖는 객체를 묶어 몇개의 그룹으로 나누는 것을 말한다. 군집 즉 cluster 로 나누는 것을 말하며, 비슷한 특성을 갖는 객체를 확인할 수 있다. 세번째 연관규칙은 데이터에 숨어있는 항목 간의 관계를 탐색하는 것을 말한다.
- 기술통계, 군집화, 연관
- 데이터를 요약해서 정보 생성 - 사실 이해, 현황파악-의사결정 지원
- 기술통계: 기술통계 분석에 기반하여 데이터 속성을 요약하는 것
- 군집화: 유사한 속성을 갖는 객체를 묶어 몇개 그룹, 군집(cluster)으로 나누는 것
- 연관규칙: 데이터에 숨어있는 항목간의 관계를 탐색하는 것
2) Predictive 유형
Predictive 유형은 축척된 과거 데이터를 통해 예측 모형을 구축하고 미래 값을 추정하는 것을 말한다. 현재 가지고 있는 데이터로 관측되지 않은 미래의 값을 평가하며 세부 유형은 예측과 분류가 있다. 데이터를 가지고 예측 모형을 만들며 회귀분석은 예측분석이라고 할 수 있다. 선형회귀와 인공신경망이 예측 모형의 구축 및 활용 예시 중 하나이며, 데이터를 넣어 최적의 파라메터 값을 찾아내어 모형을 만든다. 만들어진 모형을 가지고 예측을 하고 새로운 입력값이 들어오면 예측값을 생성해낸다.
- 예측, 분류
- 축적된 과거 데이터 연습하여 예측 모형 구축- 미래 값 추정
'통계 및 데이터분석' 카테고리의 다른 글
[통계적 연구방법] 상관관계 분석: 엑셀, R 이용하여 상관계수 구하기 (0) | 2023.06.25 |
---|---|
기계학습이란? 지도학습, 비지도학습, 강화학습, SPSS Modeler (0) | 2023.06.25 |
분산 데이터 처리 프레임워크 Hadoop (0) | 2023.06.25 |
비정형 데이터베이스가 왜 생겼을까? CAP이론, RDBMS, NoSQL (0) | 2023.06.25 |
[통계적 연구방법] 기술통계법: 엑셀과 R로 기술통계량 구하기 (0) | 2023.06.25 |