본문 바로가기

Data_engineering36

[교차검증] cross_val_score() 평가지표로 계산된 스코어에 대한 정보들을 확인하는 방법 cross_val_score()란 무엇인가? cross_val_score()는 Scikit-learn의 교차 검증을 위한 함수 중 하나입니다. 이 함수는 주어진 데이터셋을 'k'개의 fold로 분할하고, 각 fold에서 모델을 학습시키고 검증하는 과정을 'k'번 반복하여 모델의 성능을 평가합니다. cross_val_score() 사용법 다음은 cross_val_score() 함수를 사용하는 방법입니다. from sklearn.model_selection import cross_val_score scores = cross_val_score(estimator, X, y, cv=k) 여기서 estimator는 모델을 나타내는 객체이고, X와 y는 각각 특.. 2023. 2. 27.
[교차검증] cross_val_predict() 만든 모델을 통해 예측한 값들을 불러와 원하는평가 계산 방법을 적용할 수 있도록 사용 cross_val_predict() 함수란? cross_val_predict()는 scikit-learn 패키지에서 제공하는 교차 검증을 수행하는 함수 중 하나입니다. 이 함수는 데이터를 분할하여 모델 학습 및 예측을 수행하고, 예측 결과를 반환합니다. 언제 사용하나요? cross_val_predict() 함수는 모델의 예측 성능을 평가하고, 과적합 문제를 방지하기 위해 사용됩니다. 어떻게 사용하나요? cross_val_predict() 함수는 다음과 같은 방식으로 사용됩니다. from sklearn.model_selection import cross_val_predict from sklearn.linear_model .. 2023. 2. 27.
[Machine learning] k-fold cross validation k-Fold Cross Validation k-Fold Cross Validation은 머신러닝 모델의 성능을 측정하는 방법 중 하나로, 데이터를 k개의 fold로 나누어서 k번 모델을 학습하고 검증하는 방법입니다. 각 fold는 서로 다른 데이터이며, k개의 fold에서 각각 한 번씩 검증 데이터로 사용됩니다. 나머지 (k-1)개의 fold는 학습 데이터로 사용됩니다. 이러한 과정을 k번 반복하여 모델의 성능을 평균하여 측정합니다. 이 방법은 모델의 성능을 보다 정확하게 측정할 수 있으며, 일반화 성능을 높이는 데 도움이 됩니다. 또한, 데이터의 분할에 따라 성능이 달라지는 경우가 있는데, 이러한 문제를 해결할 수 있습니다. 아래는 Python 코드를 사용하여 k-Fold Cross Validation.. 2023. 2. 27.
[알고리즘] svm Scikit-learn SVM Scikit-learn은 파이썬에서 머신러닝을 수행하는 데 매우 유용한 패키지입니다. Scikit-learn의 SVM(Support Vector Machine)은 분류와 회귀 분석을 위한 머신러닝 알고리즘입니다. SVM은 특정 물체 집합을 다른 집합으로 분류하는 데 사용됩니다. SVM을 사용한 붓꽃 데이터 분류 분류 문제의 예로, 붓꽃 데이터를 이용한 SVM 모델 학습을 살펴보겠습니다. 붓꽃 데이터는 Scikit-learn 패키지에서 제공하는 예제 데이터셋 중 하나입니다. 붓꽃 데이터셋은 세 가지 종류의 붓꽃(Iris)의 꽃잎 길이와 너비, 꽃받침 길이와 너비를 포함합니다. 이 데이터셋에서는 꽃의 종류를 분류하는 문제를 다룹니다. 데이터 분류 및 모델 학습 먼저, 데이터셋을.. 2023. 2. 27.