본문 바로가기

Data_engineering/Machine_learning18

[교차검증] cross_val_predict() 만든 모델을 통해 예측한 값들을 불러와 원하는평가 계산 방법을 적용할 수 있도록 사용 cross_val_predict() 함수란? cross_val_predict()는 scikit-learn 패키지에서 제공하는 교차 검증을 수행하는 함수 중 하나입니다. 이 함수는 데이터를 분할하여 모델 학습 및 예측을 수행하고, 예측 결과를 반환합니다. 언제 사용하나요? cross_val_predict() 함수는 모델의 예측 성능을 평가하고, 과적합 문제를 방지하기 위해 사용됩니다. 어떻게 사용하나요? cross_val_predict() 함수는 다음과 같은 방식으로 사용됩니다. from sklearn.model_selection import cross_val_predict from sklearn.linear_model .. 2023. 2. 27.
[Machine learning] k-fold cross validation k-Fold Cross Validation k-Fold Cross Validation은 머신러닝 모델의 성능을 측정하는 방법 중 하나로, 데이터를 k개의 fold로 나누어서 k번 모델을 학습하고 검증하는 방법입니다. 각 fold는 서로 다른 데이터이며, k개의 fold에서 각각 한 번씩 검증 데이터로 사용됩니다. 나머지 (k-1)개의 fold는 학습 데이터로 사용됩니다. 이러한 과정을 k번 반복하여 모델의 성능을 평균하여 측정합니다. 이 방법은 모델의 성능을 보다 정확하게 측정할 수 있으며, 일반화 성능을 높이는 데 도움이 됩니다. 또한, 데이터의 분할에 따라 성능이 달라지는 경우가 있는데, 이러한 문제를 해결할 수 있습니다. 아래는 Python 코드를 사용하여 k-Fold Cross Validation.. 2023. 2. 27.
[알고리즘] svm Scikit-learn SVM Scikit-learn은 파이썬에서 머신러닝을 수행하는 데 매우 유용한 패키지입니다. Scikit-learn의 SVM(Support Vector Machine)은 분류와 회귀 분석을 위한 머신러닝 알고리즘입니다. SVM은 특정 물체 집합을 다른 집합으로 분류하는 데 사용됩니다. SVM을 사용한 붓꽃 데이터 분류 분류 문제의 예로, 붓꽃 데이터를 이용한 SVM 모델 학습을 살펴보겠습니다. 붓꽃 데이터는 Scikit-learn 패키지에서 제공하는 예제 데이터셋 중 하나입니다. 붓꽃 데이터셋은 세 가지 종류의 붓꽃(Iris)의 꽃잎 길이와 너비, 꽃받침 길이와 너비를 포함합니다. 이 데이터셋에서는 꽃의 종류를 분류하는 문제를 다룹니다. 데이터 분류 및 모델 학습 먼저, 데이터셋을.. 2023. 2. 27.
[sklearn] accuracy_score sklearn의 accuracy_score 함수 머신 러닝 모델을 다룰 때, 성능을 평가하는 것이 중요합니다. 이를 위한 일반적인 메트릭 중 하나가 정확도입니다. sklearn 라이브러리의 accuracy_score 함수는 정확도를 계산하는 유용한 도구입니다. 정확도란? 정확도는 올바른 예측 수를 전체 예측 수로 나눈 비율입니다. 이는 모델의 성능을 측정하는 간단하지만 효과적인 방법입니다. accuracy_score 사용 방법 accuracy_score 함수는 두 개의 인자를 사용합니다: y_true와 y_pred. y_true: 이는 대상 변수에 대한 실제 값의 배열입니다. y_pred: 이는 대상 변수에 대한 예측 값의 배열입니다. from sklearn.metrics import accuracy_s.. 2023. 2. 27.