본문 바로가기
통계 및 데이터분석

기계학습이란? 지도학습, 비지도학습, 강화학습, SPSS Modeler

by 연구잼 2023. 6. 25.
반응형

기계학습이란? 지도학습, 비지도학습, 강화학습, SPSS Modeler

1. 기계학습

기계학습은 인공지능기법이자 인공지능에 필요한 지식을 찾는 방법을 말한다. 다수 파라메터 갖는 모형에 데이터를 학습시켜 최적화된 파라메터 값을 찾아 일반화된 패턴을 찾고, 도출된 모형을 통해 예측이나 분류와 같은 의사결정 문제를 해결할 수 있다. 기계학습을 통해 대량의 기록 데이터를 처리 및 분석할 수 있다.

기계학습은 지도학습, 비지도학습, 강화학습으로 구분할 수 있으며 지도학습은 라벨링 작업이 필요한 학습을 말한다. 라벨링 작업은 예를 들어 사과의 이미지가 있을 때 이미지에 표시를 해 "사과"라고 직업 이름을 달아주는 작업을 말한다. 하지만 지도학습은 데이터가 많아질수록 모든 데이터를 직접 라벨링하는데에 어려움이 있다. 비지도학습의 경우는 지도학습과 반대로 라벨링 작업 없이 학습하는 과정을 말한다. 비지도학습은 데이터를 군집화하는데 이용된다. 비슷한 데이터끼리 묶는 형태를 말하며 가지고 있는 데이터를 통해 패턴을 만들고 향후를 예측하는데에도 이용된다. 강화학습은 보상을 얻으며 목표에 다가가는 학습이라고 말할 수 있다. 결과적으로 가능한 많은 보상을 축적하며 학습이 진행되고 강화학습을 통해 높은 점수를 얻을 수 있는 게임과 같은 결과물을 만들 수 있다.

    • 지도학습 : 라벨링 작업 필요, 패턴이나 트렌드 예측, 라벨에 따른 분류
    • 비지도학습 : 라벨링 작업 불필요, 데이터 군집화, 패턴분석, 결과 예측
    • 강화학습 : 자신이 한 행동에 보상 축적하며 학습

머신러닝 이미지
이미지출처: https://blog.lgcns.com/2191

2. SPSS Modeler (데이터 분석 Tool )

SPSS Modeler는 데이터 분석 도구로 데이터 마이닝을 하도록 하는 기술과 도구를 결합한 툴이다.데이터 로딩, 변환, 정제, 모델링, 그래프, 결과 출력 전 과정을 하나의 환경에서 구현 가능하며 어려운 프로그래밍 없이 데이터 마이닝 알고리즘을 활용할 수 있어 용이하다. SPSS Modeler를 통해 다양한 데이터 접근, 데이터 핸들링, Visualization, 다변화 작업 용이하며 대용량 데이터를 빠르게 DB 출력이 가능하다. 또한 다양한 모델링 분석 기법을 가지고 있으며 추가 모듈 기능이 있다. 마지막으로 R을 연동한 데이터 핸들링, 모델링, 출력이 가능하다는 것이 특징 중 하나이다.

    • 데이터 마이닝을 하도록 하는 기술과 도구를 결합한 툴
    • 데이터 로딩, 변환, 정제, 모델링, 그래프, 결과 출력 전 과정을 하나의 환경에서 구현 가능