상관관계란 무엇인가?

상관관계는 2개 변수가 선형 관계가 있는(상수 비율에서 함께 변경됨을 의미함) 범위를 표현하는 통계적 측도입니다. 원인과 결과에 관한 표현 없이 간단한 관계를 설명하는 일반적인 도구입니다.

상관관계는 어떻게 측정하나요?

표본 상관 계수인 r은 관계의 강도를 수량화합니다. 통계적 유의성에 대해서도 상관관계 여부를 검정합니다.

상관관계 분석의 제한 사항은 무엇인가요?

상관관계는 탐색되는 2개 변수가 아닌 다른 변수의 존재 또는 효과를 확인할 수 없습니다. 중요한 것은, 상관관계를 통해 원인 및 결과를 알 수 없다는 것입니다. 또한 상관관계는 곡선 관계를 정확하게 설명할 수 없습니다.

상관관계는 데이터에 관련성이 있는지를 설명합니다.

상관관계는 데이터 간 단순 관계를 설명하는 데 유용합니다. 예를 들어 산지 공원에 있는 야영지의 데이터 집합을 확인한다고 가정합니다. 야영지의 고도(산지의 높이)와 여름의 평균 최고 기온 간에 관계가 있는지에 대해 알아보려고 합니다.

각 개별 야영지의 경우 두 가지 측도는 고도 및 온도가 있습니다. 상관관계가 있는 표본에서 이 두 가지 변수를 비교하면 고도가 증가함에 따라 온도가 떨어지는 선형 관계를 찾을 수 있습니다. 음의 상관관계가 있습니다.

상관관계 수치는 무엇을 의미하나요?

상관관계를 상관 계수라고 하는 단위 없는 척도로 설명하는데, 이 계수는 -1~+1 범위에 있고 r로 표시됩니다. 통계적 유의성은 p 값으로 나타냅니다. 따라서 상관관계는 대개 2개의 키 숫자인 r = 및 **p =**로 작성됩니다.

p-값이란 무엇인가요?

p-값은 가설 검정에 사용되는 확률 측도입니다.

유의한 상관관계를 구한 후 해당 강도를 살펴볼 수 있습니다. 완벽한 양의 상관관계에는 값 1이 포함되며 완벽한 음의 상관관계에는 값 -1이 포함됩니다. 하지만 현실에서는 한 변수가 실제로 다른 변수의 프록시 측도인 경우가 아니면 완벽한 상관관계가 나타날 것으로 기대하지 않습니다. 실제로 완벽한 상관관계 수치를 살펴보면 데이터에 오차가 있다는 경고를 인지할 수 있습니다. 예를 들어 실수로 온도 대신에 각 야영지의 해수면부터의 거리를 기록한 경우 이 값은 고도와 완벽한 상관관계가 있습니다.

또 다른 유용한 정보는 관측 수인 N입니다. 대부분 통계적 검정처럼 표본 크기를 알고 있으면 표본의 강도 및 표본이 모집단을 얼마나 잘 나타내는지 판단하는 데 도움이 됩니다. 예를 들어 야영지 5개의 고도 및 온도만 측정했지만 공원에 2000개 야영지가 있는 경우 표본에 다른 야영지를 추가하려고 합니다.