본문 바로가기
Data_engineering/Machine_learning

[Machine_learning]이진분류

by kyhh1229 2023. 2. 26.

 

머신러닝에서 여러 개의 종류 ( 혹은 클래스(class) 라고 부릅니다) 중

하나를 구별해 내는 문제를 분류 ( classification ) 라고 부릅니다

2개의 클래스 중 하나를 고르는 문제를 이진 분류 ( binary classification ) 라고 합니다

  • 여기에서 클래스는 파이썬 클래스와는 다릅니다

 

이진분류 ( binary calssification )

이진 분류는 둘 중 하나의 결과를 예측하는 문제입니다. 
예를 들어, 이메일이 스팸인지 아닌지, 종양이 양성인지 악성인지 등을 예측하는 문제에 적용됩니다.

이진 분류 모델은 주어진 입력 변수를 기반으로 두 개의 클래스 중 하나에 해당하는 출력 변수를 예측합니다. 
일반적으로, 출력 변수는 0 또는 1로 표시되며, 0은 첫 번째 클래스를 나타내고 1은 두 번째 클래스를 나타냅니다.

이진 분류는 매우 일반적인 문제이며, 기계 학습 분야에서 많이 다루어지고 있습니다.

 

더 쉬운 설명

이진 분류는 매우 간단한 분류 문제 중 하나입니다. 
예를 들어, 의료 진단에서 이진 분류는 암 환자인지 아닌지를 판단하는 것입니다. 
여기서 분류해야 하는 클래스는 "암 환자"와 "건강한 사람"입니다.

또 다른 예로는 스팸 필터링이 있습니다. 
여기서 분류해야 하는 클래스는 "스팸"과 "스팸이 아닌 것"입니다.

즉, 이진 분류는 단순히 두 가지 범주 중 하나로 분류하는 문제입니다. 
이진 분류는 대부분의 기계 학습 분야에서 매우 일반적이며, 많은 애플리케이션에서 활용됩니다.

 

댓글