corr
메서드는 각 열 간의 상관 계수를 반환하는 메서드입니다.corrwith
메서드는 두 DataFrame객체의 동일한 행/열 간의 상관 계수를 반환하는 메서드입니다.상관계수 산정 방식에는 피어슨 상관계수
, 켄달-타우 상관계수
, 스피어먼 상관계수
를 사용합니다.
[피어슨 상관계수]
피어슨 상관계수
는 두 변수 간의 선형 상관관계를 계량화 한 수치입니다.
코시-슈바르츠 부등식
에 의해 +1과 -1사이의 값을 가집니다.
+1의 경우 완벽한 양의 선형 상관 관계, -1의 경우 완벽한 음의 상관관계, 0의 경우 선형 상관관계를 갖지 않습니다.
서로 다른 상관계수 값을 갖는 산포도 다이어그램의 예
※출처 : 위키피디아 '피어슨 상관계수' 항목**[켄달-타우상관계수]**켄달-타우 상관계수
는 두 변수들간의 순위를 비교해서 연관성을 계산하는 방식입니다.예를들어 어린이의 나이와 키에 대한 아래와 같은 순위 데이터를 보면, 나이순위에 따라 키의 순위가 동일한 것을 알 수 있습니다.
순위 | A | B | C | D | E |
---|---|---|---|---|---|
나이 | 1 | 3 | 4 | 2 | 5 |
키 | 1 | 3 | 4 | 2 | 5 |
이런 경우
켄달-타우 상관계수
의 경우 완벽한 양의 상관 계수인 +1이 됩니다.
[스피어먼 상관계수]
스피어먼 상관계수