본문 바로가기

Data_engineering/Machine_learning18

[sklearn] accuracy_score sklearn accuracy_score accuracy_score 함수는 sklearn 라이브러리에서 제공되며, 분류 모델의 예측 결과와 실제 결과를 비교하여 정확도를 계산하는 함수입니다. 이 함수는 두 개의 인자를 받습니다. 첫 번째 인자는 실제 결과값, 두 번째 인자는 예측 결과값입니다. 이 두 인자는 모두 같은 길이의 배열이어야 합니다. accuracy_score 함수는 이렇게 계산된 정확도 값을 반환합니다. 정확도는 0에서 1 사이의 값으로 나타나며, 1에 가까울수록 모델이 정확하게 예측한 것입니다. 예를 들어, 다음과 같이 사용할 수 있습니다. from sklearn.metrics import accuracy_score y_true = [0, 1, 2, 3, 4] y_pred = [0, 2, .. 2023. 3. 6.
[sklearn] OneHotEncoder sklearn의 OneHotEncoder OneHotEncoder는 Scikit-learn 라이브러리에서 제공하는 데이터 전처리(preprocessing) 도구 중 하나로, 범주형(categorical) 데이터를 수치형(numerical) 데이터로 변환해주는 역할을 합니다. 예를 들어, "색깔"이라는 feature가 있고 그 값으로 "빨간색", "파란색", "노란색" 등이 있다면, 이 feature을 그대로 머신러닝 모델에 넣을 수는 없습니다. 따라서, 이런 경우에 OneHotEncoder를 사용하여 "빨간색"을 [1, 0, 0], "파란색"을 [0, 1, 0], "노란색"을 [0, 0, 1]와 같이 수치형으로 변환해줍니다. OneHotEncoder의 사용 방법 OneHotEncoder를 사용하기 위해서.. 2023. 2. 28.
[교차검증] cross_validate() 여러 개의 평가지표를 사용하고 싶을 때 사용 cross_validate() cross_validate()는 Scikit-learn 라이브러리에서 제공하는 cross-validation(교차 검증) 기능의 한 가지 방법입니다. 이 함수를 사용하면 데이터셋을 여러 개의 fold(겹)로 나누어 각각의 fold를 테스트셋으로 사용하고 나머지 fold를 학습셋으로 사용하여 모델을 학습시키고 평가하는 과정을 반복할 수 있습니다. 함수 구문 cross_validate(estimator, X, y=None, groups=None, scoring=None, n_jobs=None, cv=None, verbose=0, fit_params=None, pre_dispatch='2*n_jobs', return_train_scor.. 2023. 2. 27.
[교차검증] cross_val_score() 평가지표로 계산된 스코어에 대한 정보들을 확인하는 방법 cross_val_score()란 무엇인가? cross_val_score()는 Scikit-learn의 교차 검증을 위한 함수 중 하나입니다. 이 함수는 주어진 데이터셋을 'k'개의 fold로 분할하고, 각 fold에서 모델을 학습시키고 검증하는 과정을 'k'번 반복하여 모델의 성능을 평가합니다. cross_val_score() 사용법 다음은 cross_val_score() 함수를 사용하는 방법입니다. from sklearn.model_selection import cross_val_score scores = cross_val_score(estimator, X, y, cv=k) 여기서 estimator는 모델을 나타내는 객체이고, X와 y는 각각 특.. 2023. 2. 27.