본문 바로가기

Data_engineering/Machine_learning18

[sklearn] score() sklearn - score() 메서드 score() 메서드는 머신러닝 모델에서 모델의 성능을 평가하는 데 사용됩니다. 이 메서드는 모델이 예측한 결과와 실제 결과를 비교하여 정확도를 계산합니다. 예를 들어, 붓꽃 데이터를 사용하여 붓꽃의 품종을 예측하는 머신러닝 모델을 만들었다고 가정해봅시다. 우리는 이 모델의 성능을 평가하고 싶습니다. 이 때 score() 메서드를 사용하여 모델의 정확도를 평가할 수 있습니다. from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier iris = load_iris() X = iris.data y = iris.target model = DecisionTreeClassifi.. 2023. 2. 26.
[sklearn] fit () sklearn의 fit() 메서드란? fit() 메서드는 Scikit-learn 라이브러리에서 제공하는 메서드 중 하나입니다. 이 메서드는 주어진 데이터를 사용하여 모델을 학습시키는 데 사용됩니다. 사용법 fit() 메서드는 모델 객체에서 호출됩니다. 일반적으로, 모델을 만든 후, 데이터를 사용하여 모델을 학습시키는 데 사용됩니다. from sklearn.linear_model import LinearRegression X = [[1, 2], [3, 4], [5, 6]] y = [7, 8, 9] model = LinearRegression() model.fit(X, y) 위 코드에서 LinearRegression() 클래스를 사용하여 모델을 만든 후, fit() 메서드를 사용하여 X와 y 데이터를 사용하.. 2023. 2. 26.
[sklearn] train_test_split - stratify stratify 매개변수는 클래스 불균형이 있는 경우 각 클래스의 비율을 유지하도록 분할하기 위해 사용됩니다. 예를 들어, 타겟 변수 y가 0과 1로 구성되어 있고, 전체 데이터의 80%를 훈련 데이터로 사용하고 싶은 경우, stratify=y로 지정하면 각 클래스(0과 1)의 비율을 유지한 채로 80:20으로 데이터가 나누어집니다. 원하는 타겟 데이터를 찾아서 나누는 비율을 일정하게 만들어주는것 분리모델 분류 이진분류 Classifier 모델에선 항상 쓰는게 좋다는 의견 예측모델 회귀 Regressor 모델에선 잘 안쓴다는 의견 2023. 2. 26.
[Machine_learning] 훈련 세트(train)와 테스트 세트(test) 훈련 세트(train set) 훈련 세트란 모델을 학습시키는 데 사용되는 데이터의 일부분입니다. 모델이 학습하는 과정에서 훈련 세트의 데이터를 이용해 가중치(weight)와 절편(bias)을 조절하며, 최적의 모델을 만들어냅니다. 따라서, 훈련 세트의 데이터가 모델의 학습에 큰 영향을 미칩니다. 테스트 세트(test set) 반면, 테스트 세트는 학습된 모델이 얼마나 잘 일반화되어 새로운 데이터를 예측할 수 있는지를 평가하는 데 사용됩니다. 즉, 모델이 이전에 본 적 없는 새로운 데이터를 얼마나 잘 예측하는지를 측정하는 데 사용됩니다. 훈련 세트와 달리, 테스트 세트는 모델의 학습에 전혀 사용되지 않습니다. 훈련 세트와 테스트 세트의 중요성 훈련 세트와 테스트 세트를 나누는 이유는, 모델이 학습 데이터를.. 2023. 2. 26.