[ML] 분류(Classification)와 회귀(Regression)의 차이

데이터 분석 또는 머신러닝을 공부하면서 가장 처음 접하게 되는 개념 중 하나가 바로 "분류"와 "회귀"이다.

둘 다 입력 데이터로부터 결과를 예측한다는 공통점이 있지만,

예측하려는 값이 ‘카테고리’냐, ‘숫자’냐에 따라 적용되는 방식과 모델이 완전히 달라진다.

이 글에서는 직접 학습하면서 두 개념의 차이와 예시를 이해한만큼 설명하려고 한다.

분류 (Classification)

개념 :

분류는 데이터를 사전에 정의된 그룹(클래스) 중 하나로 나누는 작업이다.

결국에 "이 데이터는 어떤 범주에 속하나요?"라는 질문에 답하는 문제이다.

예시는 다음과 같다

사용가능 한 알고리즘은 다음과 같다. 최근에는 상위 3개 알고리즘을 사용해보기도 하였다

평가 지표

개념 :

회귀는 숫자(연속값)를 예측하는 문제이다.

즉, "이 데이터의 결과 값은 얼마인가요?" 질문에 예측하는 것이다.

예시 :

사용 알고리즘은 다음과 같다. (위의 분류모델과는 확실히 다르다. 이제 구분을 할줄 알아야한다.)

평가 지표

보다 쉬운 설명을 위해 분류와 회귀를 표로 비교해보았다.

나는 하나의 문제를 여러 시각으로 바라보고자 한다.

동일한 데이터를 가지고도 문제를 분류/회귀 중 어떤 방식으로 정의하느냐에 따라 접근이 달라질 수 있다.

학생 성적 데이터를 예시로 설명을 해보고자 한다.

접근 방식 설명 모델 종류

기존에 대학교에서 3학년 때 머신러닝을 들었을 때와 다르게 이제는 쉽게 이해되어가고 있다.

사실 대학교에서는 정기고사를 잘 보기위해 외웠다면, 지금은 에이블스쿨을 통해 실제 구현하며 하다보니 쉽게 체득되어가고 있다.

다음은 직접 pandas와 keras를 활용하여 분류 과정을 기술해보고자 한다

실시간 객체탐지 YOLO란? (2)	2025.04.24
RAG(Retrieval-Augmented Generation)와 Vector DB 란? (3)	2025.04.21
Sequential vs Class: PyTorch 모델 정의 방법과 비교 (1)	2025.04.14
[OpenCV] Ubuntu 22.04 버전에서 OpenCV 4.10.0 GPU 적용하기 (2)	2024.10.20
NVIDIA Tensor RT 에 대해 알아보기 (3)	2023.08.28