SMALL
편차(Deviation)
데이터와 평균의 차
데이터가 많을경우 데이터의 평균의 차이를 숫자 하나로 요약해주는 놈이 없을까?....
분산(variance)
편차의 제곱의 합 / 데이터의수 -1(자유도)
편차 제곱을, 데이터의개수-1 로 나눈것 → 데이터의 차이를 하나의 숫자로 나타냄
값이 너무 커 ... 좀 줄이고 싶다
표준편차(standard deviation)
분산에 루트를 계산
공분산(covariance)
두개의 컬럼 X와 Y가 있을때 컬럼1이 증가 할때 컬럼2가 같이 증가 하는가 아니면 감소하는가를 나타내는 지표


공분산 계산

공분산 계산
영어 점수가 낮으면 국어 점수도 낮나??


상관관계(correlation)
공분산을 X와 Y의 표준편차(X,Y에 저장된 값들의 차이)로 나눠서 비율을 조회
숫자값이 저장된 컬럼 사이의 상관 관계를 계산

상관관계 시각화

상관 관계의 계산

LIST
'머신러닝 딥러닝' 카테고리의 다른 글
AUC-ROC 커브 (0) | 2022.01.20 |
---|---|
0119 Ensenble, XGBoost (0) | 2022.01.19 |
GridSearchCV (0) | 2022.01.19 |
0118 confusion matrix( 오차 행렬), Information Gain(IG) (0) | 2022.01.18 |
0117 Random Forest (0) | 2022.01.17 |
댓글