머신러닝에서 여러 개의 종류 ( 혹은 클래스(class) 라고 부릅니다) 중
하나를 구별해 내는 문제를 분류 ( classification ) 라고 부릅니다
2개의 클래스 중 하나를 고르는 문제를 이진 분류 ( binary classification ) 라고 합니다
- 여기에서 클래스는 파이썬 클래스와는 다릅니다
이진분류 ( binary calssification )
이진 분류는 둘 중 하나의 결과를 예측하는 문제입니다.
예를 들어, 이메일이 스팸인지 아닌지, 종양이 양성인지 악성인지 등을 예측하는 문제에 적용됩니다.
이진 분류 모델은 주어진 입력 변수를 기반으로 두 개의 클래스 중 하나에 해당하는 출력 변수를 예측합니다.
일반적으로, 출력 변수는 0 또는 1로 표시되며, 0은 첫 번째 클래스를 나타내고 1은 두 번째 클래스를 나타냅니다.
이진 분류는 매우 일반적인 문제이며, 기계 학습 분야에서 많이 다루어지고 있습니다.
더 쉬운 설명
이진 분류는 매우 간단한 분류 문제 중 하나입니다.
예를 들어, 의료 진단에서 이진 분류는 암 환자인지 아닌지를 판단하는 것입니다.
여기서 분류해야 하는 클래스는 "암 환자"와 "건강한 사람"입니다.
또 다른 예로는 스팸 필터링이 있습니다.
여기서 분류해야 하는 클래스는 "스팸"과 "스팸이 아닌 것"입니다.
즉, 이진 분류는 단순히 두 가지 범주 중 하나로 분류하는 문제입니다.
이진 분류는 대부분의 기계 학습 분야에서 매우 일반적이며, 많은 애플리케이션에서 활용됩니다.
'Data_engineering > Machine_learning' 카테고리의 다른 글
[sklearn] score() (0) | 2023.02.26 |
---|---|
[sklearn] fit () (0) | 2023.02.26 |
[sklearn] train_test_split - stratify (0) | 2023.02.26 |
[Machine_learning] 훈련 세트(train)와 테스트 세트(test) (0) | 2023.02.26 |
[Machine_learning] 지도 학습_비지도 학습 (0) | 2023.02.26 |
댓글