상관계수 (corr / corrwith)

DataFrame.corr(method='pearson', min_periods=1)

DataFrame.corrwith(other, axis=0, drop=False, method='pearson')

개요

corr메서드는 각 열 간의 상관 계수를 반환하는 메서드입니다.corrwith메서드는 두 DataFrame객체의 동일한 행/열 간의 상관 계수를 반환하는 메서드입니다.상관계수 산정 방식에는 피어슨 상관계수켄달-타우 상관계수스피어먼 상관계수를 사용합니다.

[피어슨 상관계수]

피어슨 상관계수

는 두 변수 간의 선형 상관관계를 계량화 한 수치입니다.

코시-슈바르츠 부등식

에 의해 +1과 -1사이의 값을 가집니다.

+1의 경우 완벽한 양의 선형 상관 관계, -1의 경우 완벽한 음의 상관관계, 0의 경우 선형 상관관계를 갖지 않습니다.

https://upload.wikimedia.org/wikipedia/commons/thumb/3/34/Correlation_coefficient.png/400px-Correlation_coefficient.png

서로 다른 상관계수 값을 갖는 산포도 다이어그램의 예

※출처 : 위키피디아 '피어슨 상관계수' 항목**[켄달-타우상관계수]**켄달-타우 상관계수는 두 변수들간의 순위를 비교해서 연관성을 계산하는 방식입니다.예를들어 어린이의 나이와 키에 대한 아래와 같은 순위 데이터를 보면, 나이순위에 따라 키의 순위가 동일한 것을 알 수 있습니다.

순위 A B C D E
나이 1 3 4 2 5
1 3 4 2 5

이런 경우

켄달-타우 상관계수

의 경우 완벽한 양의 상관 계수인 +1이 됩니다.

[스피어먼 상관계수]

스피어먼 상관계수