본문 바로가기

Data_engineering36

[sklearn] accuracy_score sklearn의 accuracy_score 함수 머신 러닝 모델을 다룰 때, 성능을 평가하는 것이 중요합니다. 이를 위한 일반적인 메트릭 중 하나가 정확도입니다. sklearn 라이브러리의 accuracy_score 함수는 정확도를 계산하는 유용한 도구입니다. 정확도란? 정확도는 올바른 예측 수를 전체 예측 수로 나눈 비율입니다. 이는 모델의 성능을 측정하는 간단하지만 효과적인 방법입니다. accuracy_score 사용 방법 accuracy_score 함수는 두 개의 인자를 사용합니다: y_true와 y_pred. y_true: 이는 대상 변수에 대한 실제 값의 배열입니다. y_pred: 이는 대상 변수에 대한 예측 값의 배열입니다. from sklearn.metrics import accuracy_s.. 2023. 2. 27.
[Machine learning] 교차검증 머신러닝 검증 세트란 무엇인가요? 머신러닝 모델은 학습 데이터를 이용해 학습을 하고, 이를 기반으로 새로운 데이터에 대한 예측을 수행합니다. 그러나 학습 데이터는 모델이 어떻게 작동하는지 평가하기에 충분하지 않습니다. 따라서, 모델이 학습하지 않은 새로운 데이터에 대한 예측 능력을 평가하기 위해 검증 세트를 사용합니다. 검증 세트를 사용하는 이유는 무엇인가요? 검증 세트를 사용하는 이유는 머신러닝 모델이 학습한 데이터에 대해서는 높은 정확도를 보일 수 있지만, 실제 데이터에서는 성능이 떨어지는 경우가 많기 때문입니다. 이는 과적합(overfitting) 현상으로 인해 발생합니다. 검증 세트를 사용하면 과적합을 방지하고 모델의 일반화 성능을 평가할 수 있습니다. 검증 세트를 만드는 방법은 무엇인가요? 검증.. 2023. 2. 27.
[Numpy] np.concatenate() Numpy np.concatenate() np.concatenate() 함수는 numpy 배열을 연결하여 하나의 배열로 만들어주는 함수입니다. 사용법 np.concatenate() 함수는 다음과 같은 인자를 받습니다. np.concatenate((array1, array2, ...), axis=0) array1, array2, ... : 연결하고자 하는 numpy 배열을 나타냅니다. axis : 연결 방향을 나타내는 정수형 인자입니다. axis=0인 경우, 첫 번째 차원을 따라 배열이 연결됩니다. axis=1인 경우, 두 번째 차원을 따라 배열이 연결됩니다. 디폴트 값은 axis=0입니다. 예시 import numpy as np a = np.array([[1, 2], [3, 4]]) b = np.arra.. 2023. 2. 27.
[Numpy] np.zeros() [Numpy] np.zeros() 함수 개요 numpy.zeros() 함수는 지정된 shape와 dtype을 가진 배열을 생성하며, 배열의 모든 요소를 0으로 채웁니다. 문법 numpy.zeros(shape, dtype=float, order='C') 매개변수 shape : int 또는 tuple of int. 배열의 차원을 지정하는 정수 또는 정수 튜플입니다. dtype : 배열 요소의 데이터 유형을 선택적으로 지정합니다. 기본값은 float입니다. order : 배열 메모리 레이아웃을 선택적으로 지정합니다. 기본값은 'C'입니다. 반환값 numpy.zeros() 함수는 지정된 shape와 dtype을 가진 배열을 반환합니다. 모든 요소는 0으로 채워집니다 예제 import numpy as np # 1.. 2023. 2. 27.