공분산 분석(ANCOVA, Analysis of Covariance)은 범주형 독립변수(집단)와 연속형 종속변수의 관계를 비교할 때, 종속변수에 영향을 미칠 수 있는 연속형 공변인(covariate)을 함께 모형에 포함하여 그 영향을 통계적으로 보정한 뒤 집단의 차이를 검정하는 방법입니다.
연구자가 궁금해하는 것이 “집단이 정말로 차이를 만드는가”인데, 현실의 데이터에서는 집단 비교를 방해하는 요인이 종종 섞여 들어옵니다.
예컨대 실험집단과 통제집단의 학기말 점수를 비교하고 싶어도, 학기초 수준(사전 점수)이 학기말 점수에 큰 영향을 준다면 집단 차이가 사전 수준 차이 때문에 과대 또는 과소 추정될 수 있습니다.
ANCOVA는 이때 사전 점수 같은 공변인의 영향을 모형 안에서 반영해, 공변인 효과를 고려한 상태에서 집단의 효과를 더 선명하게 평가하도록 돕습니다.
이 분석이 특히 유용한 이유는, ANCOVA가 단지 “평균을 비교한다”에서 멈추지 않고, “평균을 비교하되 공변인에 의한 변동을 제거(또는 보정)한 뒤 비교한다”는 논리를 갖고 있기 때문입니다. 그래서 ANCOVA는 분산분석(ANOVA)의 집단 비교 구조와 회귀분석의 보정 논리를 결합한 형태로 이해하는 것이 가장 정확합니다.
연구자가 실제로 보고하는 값도 단순한 원평균(raw mean)만이 아니라, 공변인을 통제한 후 계산되는 조정평균(adjusㅁted mean) 또는 추정된 주변평균(estimated marginal mean)입니다. 말하자면 ANCOVA는 “공변인을 고려했을 때도 집단 차이가 남는가”를 묻는 분석입니다.
공분산 분석의 목적
공분산 분석의 목적은 크게 두 축으로 정리할 수 있습니다.
첫째, 독립변수(집단)의 효과를 검정하면서 공변인의 영향을 통계적으로 보정하여 집단 효과의 해석을 명료하게 만드는 것입니다.
둘째, 공변인에 의해 설명되는 변동을 제거함으로써 오차를 줄이고 검정력을 높여 집단 차이를 더 안정적으로 탐지하는 것입니다. 이 목적을 충실히 수행하려면 분석에서 다루는 변인들의 역할이 분명해야 합니다.
ANCOVA의 주요 구성 요소는 다음과 같습니다.
독립변수는 비교하고자 하는 집단이며 범주형(명목/서열) 변수로 입력됩니다(예: 새로운 학습 방법 그룹 vs 기존 학습 방법 그룹).
종속변수는 집단에 따라 달라질 것으로 기대되는 연속형 결과변수입니다(예: 학기말 시험 점수).
공변인은 종속변수에 영향을 줄 가능성이 높지만, 연구자는 이를 통제한 뒤 집단 차이를 보고 싶은 연속형 변수입니다(예: 사전 시험 점수, 연령, 기초 능력 점수 등). 다만 공변인은 “통제변수”라는 단어로 뭉뚱그리기보다, ANCOVA 맥락에서는 공변인(covariate)이라는 표현을 쓰는 편이 더 정확합니다.‘외생변수’라는 표현은 의미가 넓어, 통계적 모형 안에서 무엇을 어떻게 넣어 보정한다는 의미가 흐려질 수 있기 때문입니다.
ANCOVA가 필요한 상황은 의외로 흔합니다.
예컨대 학생들의 성취도를 집단별로 비교하려고 하는데, 사전 점수가 학기말 성취도와 강하게 연결되어 있다면, “집단의 차이”가 사실상 “사전 점수 차이”로부터 비롯될 가능성이 있습니다. 이때 공변인을 포함하지 않은 단순 ANOVA는 집단 효과를 왜곡할 수 있고, 반대로 ANCOVA는 사전 점수를 공변인으로 포함해 집단 비교를 보다 공정한 기준선 위에 올려놓습니다. 이를 한 문장으로 정리하면, ANCOVA는 “종속변수에 영향을 주는 공변인을 통제한 뒤 집단의 순수한 효과를 평가하는 분석”입니다.
이 논리를 더 직관적으로 잡아 주기 위해, ANCOVA의 모형을 간단히 한 줄로 제시하는 것도 좋습니다. 일반적으로 다음처럼 표현할 수 있습니다.
\(
Y_{ij}=\mu+\tau_i+\beta(X_{ij}-\bar X)+\varepsilon_{ij}
\)
여기서 \(Y_{ij}\)는 i집단의 j번째 참여자의 종속변수(예: 학기말 점수), \(\tau_i\)는 집단 효과, \(X_{ij}\)는 공변인(예: 사전 점수), \(\beta\)는 공변인의 기울기(회귀계수), \(\varepsilon_{ij}\)는 오차입니다. 그리고 집단별 조정평균은 공변인 평균 차이를 기울기 \(\beta\)로 보정해 계산된다고 이해할 수 있습니다. 예를 들어 조정평균의 핵심 직관은 다음과 같이 쓸 수 있습니다.
\(
\bar Y_{i,adj}=\bar Y_i-\beta(\bar X_i-\bar X)
\)
즉 집단 i의 원평균 \(\bar Y_i\)에서, 그 집단 공변인 평균이 전체 공변인 평균과 얼마나 다른지 \((\bar X_i-\bar X)\)를 기울기 \(\beta\)만큼 보정해 집단 간 비교를 “같은 출발선”에 맞추는 셈입니다.
연구가설의 설정
연구 가설 설정은 집단 효과와 공변인 효과를 분리해 쓰는 것이 깔끔합니다. 집단 효과에 대한 귀무가설은 “공변인을 보정한 뒤에도 집단 간 조정평균 차이가 없다”입니다.
2집단이면
\(H_0:\mu_1^{adj}=\mu_2^{adj}\)로 충분하고,
3집단 이상이면
\(H_0:\mu_1^{adj}=\mu_2^{adj}=\cdots=\mu_k^{adj}\)로 씁니다.
대립가설은 “적어도 한 집단의 조정평균이 다른 집단과 다르다”로 두는 것이 표준적입니다.
수식으로 굳이 쓰면
\(\exists i\neq j:\mu_i^{adj}\neq \mu_j^{adj}\)처럼 표현할 수 있습니다. 여기서 중요한 포인트는 대립가설을 \(\mu_1\neq \mu_2\neq \mu_3\)처럼 쓰면 “모든 평균이 서로 다르다”는 과도한 의미로 읽힐 수 있어 피하는 편이 안전하다는 점입니다.
공변인 효과 가설은 “공변인이 종속변수와 상관이 있다”로 말할 수도 있지만, ANCOVA가 GLM/회귀 기반이라는 점을 살리려면 공변인의 기울기 \(\beta\)에 대한 검정으로 쓰는 것이 더 정교합니다.
즉 \(H_0:\beta=0\) 대 \(H_a:\beta\neq 0\) 형태가 자연스럽습니다. 결과 보고에서도 “공변인의 효과가 유의했다”는 말은 사실상 “\(\beta\)가 0이 아니었다”는 의미로 읽힙니다.
이제 사용 예시를 들어 보면, 연구 질문은 다음처럼 정리할 수 있습니다.
“새로운 학습 방법이 학생들의 학업 성취도에 미치는 효과는 기존 방법과 비교하여 어떠한가. 단, 사전 학업 수준(사전 점수)의 영향을 통제하여 학습 방법의 순수한 효과를 분석한다.”
이 질문에서 독립변수는 학습 방법(새로운 vs 기존), 종속변수는 학기말 시험 점수(성취도), 공변인은 사전 시험 점수(사전 수준)입니다. 연구 설계의 핵심은 사전 점수 차이가 집단 효과로 오해되지 않도록 보정한 뒤, 학습 방법이 여전히 유의한 차이를 만드는지 확인하는 것입니다.
예시 데이터 구조는 아래처럼 제시하면 독자가 즉시 이해합니다.
| 학생 ID | 학습 방법(Group) | 사전 점수(PreScore) | 성취도 점수(PostScore) |
|---|---|---|---|
| 1 | 새로운 방법 | 70 | 85 |
| 2 | 기존 방법 | 65 | 78 |
| 3 | 새로운 방법 | 75 | 88 |
| 4 | 기존 방법 | 60 | 70 |
| … | … | … | … |
분석 절차는 “데이터 입력 → ANCOVA 실행 → 가정 점검 → 주효과 해석(집단·공변인) → 조정평균 비교(필요 시)” 순서로 진행합니다.
여기서 한 가지를 더 강조하면, ANCOVA는 ‘원평균 차이’보다 ‘조정평균 차이’를 보고하는 분석이므로, 결과를 해석할 때도 “공변인을 통제한 후에도 집단 차이가 유의한가”라는 문장이 반드시 들어가야 합니다.
다음은 IBM SPSS Statistics에서 ANCOVA를 수행하는 전형적인 단계입니다.
먼저 데이터 파일에서 Group(집단)은 명목형, PreScore와 PostScore는 척도형으로 설정합니다. 이후 Analyze → General Linear Model → Univariate로 들어가 Dependent Variable에 PostScore, Fixed Factor에 Group, Covariate에 PreScore를 지정합니다.
Options에서는 Descriptive statistics와 Homogeneity tests를 체크해 기본 출력 정보를 확보하고, 가능하면 Estimated Marginal Means(추정 주변평균, 조정평균)를 출력하도록 설정해 집단별 조정평균과 신뢰구간을 함께 제시하는 것이 좋습니다. Plots는 학습자 입장에서는 이해를 돕지만, 논문 보고에는 조정평균 표가 더 직접적일 때가 많습니다.
여기서 실무적으로 가장 자주 놓치는 것이 가정 점검입니다.
ANCOVA는 “공변인으로 보정한 집단 비교”이기 때문에 몇 가지 가정이 흔들리면 해석이 곧바로 불안해집니다.
첫째, 공변인과 종속변수의 관계가 선형이어야 합니다. 이는 산점도나 잔차 패턴으로 점검합니다.
둘째, 가장 핵심적인 ANCOVA 고유 가정인 “공통 경사(동질적 회귀기울기)”가 필요합니다. 이는 집단×공변인 상호작용이 유의하지 않아야 한다는 뜻이며, 실무에서는 Group×PreScore 항을 포함한 모형을 한 번 돌려 상호작용 유의성을 확인하는 방식으로 점검합니다.
셋째, 잔차의 등분산성과(Levene 등) 잔차 정규성이 크게 위반되지 않아야 합니다.
넷째, 관측치는 독립이어야 합니다(같은 반/같은 교사가 반복 측정한 자료라면 혼합모형을 고민해야 할 수 있습니다).
마지막으로 설계 관점에서, 공변인은 가능하면 처치 이전에 측정된 변수여야 해석이 안정적입니다. 처치가 공변인을 변화시켰다면 “통제”라는 표현이 오히려 인과적 의미를 흐릴 수 있습니다.
결과 요약: 주요 표 구성
SPSS에서 주요 결과는 아래와 같은 표로 나타납니다.
(1) Descriptive Statistics (기술 통계)
그룹별로 종속 변수의 평균과 표준편차를 제공합니다.
| Group | N | Mean (PostScore) | Std. Deviation |
|---|---|---|---|
| 기존 방법 (1) | 30 | 70.50 | 5.25 |
| 새로운 방법 (2) | 30 | 75.80 | 4.95 |
해석: 새로운 방법 그룹의 평균 점수가 기존 방법 그룹보다 약 5.3점 높습니다. 하지만, 이 차이가 통계적으로 유의한지는 추가 분석이 필요합니다.
(2) Levene's Test of Equality of Error Variances (오차 분산의 동일성 검정)
| Test Statistic | df1 | df2 | Sig. (p-value) |
|---|---|---|---|
| 1.75 | 1 | 58 | 0.192 |
해석: p-값이 0.192 > 0.05이므로 오차 분산이 동일하다는 가정을 충족합니다.
(3) Tests of Between-Subjects Effects (주효과 검정)
| Source | Type III Sum of Squares | df | Mean Square | F | Sig. (p-value) |
|---|---|---|---|---|---|
| Corrected Model | 420.25 | 2 | 210.12 | 15.87 | 0.000 |
| Intercept | 56780.12 | 1 | 56780.12 | 4285.67 | 0.000 |
| PreScore (공변인) | 180.45 | 1 | 180.45 | 13.60 | 0.001 |
| Group (학습 방법) | 235.75 | 1 | 235.75 | 17.75 | 0.000 |
| Error | 770.45 | 57 | 13.52 |
해석:
- 공변인(PreScore): p-값이 0.001로 유의미하므로, 사전 점수가 성취도에 영향을 미친다고 볼 수 있습니다.
- 독립 변수(Group): p-값이 0.000으로 유의미하므로, 학습 방법에 따라 성취도 점수가 달라집니다.
- F값은 효과의 크기를 나타냅니다. 높은 값일수록 큰 차이를 의미합니다.
(4) Pairwise Comparisons (사후 검정)
| Group Comparison | Mean Difference | Std. Error | Sig. (p-value) |
|---|---|---|---|
| 기존 vs. 새로운 | -5.30 | 1.25 | 0.000 |
해석: 기존 방법과 새로운 방법 간의 평균 차이는 5.30점이며, p-값이 0.000으로 유의미합니다. 즉, 새로운 학습 방법이 성취도 점수를 유의미하게 높이는 것으로 나타났습니다.
결과 해석 (예시)
논문에서 공분산 분석(ANCOVA) 결과를 보고하는 방법은 APA 스타일을 따르는 것이 일반적입니다. 아래는 공분산 분석 결과를 논문에 적합한 표로 정리하고, 이를 기반으로 해석한 예시입니다.
결과표 작성
Table 1. Descriptive Statistics by Group
| Group | N | Mean (PostScore) | Std. Deviation |
|---|---|---|---|
| Traditional Method (1) | 30 | 70.50 | 5.25 |
| New Method (2) | 30 | 75.80 | 4.95 |
Table 2. ANCOVA Results
| Source | SS | df | MS | F | p | Partial ηp2 |
|---|---|---|---|---|---|---|
| PreScore (Covariate) | 180.45 | 1 | 180.45 | 13.60 | 0.001 | 0.193 |
| Group (Teaching Method) | 235.75 | 1 | 235.75 | 17.75 | 0.000 | 0.237 |
| Error | 770.45 | 57 | 13.52 | |||
| Total | 56780.12 | 59 |
Table 3. Pairwise Comparisons
| Group Comparison | Mean Difference | Std. Error | p |
|---|---|---|---|
| Traditional vs. New | -5.30 | 1.25 | 0.000 |
결과 해석
연구 질문
새로운 학습 방법이 기존 학습 방법에 비해 학생들의 학업 성취도를 유의미하게 향상시키는가?
결과 요약
오차 분산의 동일성 검정: Levene's Test 결과 (p = 0.192 > 0.05)로, 오차 분산이 동일하다는 가정을 충족합니다.
기술 통계:
- 새로운 학습 방법 그룹의 평균 성취도 점수(75.80점)가 기존 학습 방법 그룹(70.50점)보다 약 5.3점 더 높았습니다.
공변인 효과:
- 사전 점수(PreScore, 공변인)는 성취도 점수에 유의미한 영향을 미쳤습니다 (F(1, 57) = 13.60, p = 0.001, ηp2 = 0.193).
- PreScore(공변인)의 p = 0.001 < 0.05로, 사전 점수가 성취도에 유의미한 영향을 미칩니다.
- 이는 학생들의 사전 학업 수준이 성취도 점수와 높은 상관이 있음을 의미합니다.
독립 변수 효과:
- 학습 방법(Group)은 성취도 점수에 유의미한 영향을 미쳤습니다 (F(1, 57) = 17.75, p = 0.000, ηp2 = 0.237).
- Group(학습 방법)의 p = 0.000 < 0.05로, 새로운 학습 방법이 기존 방법보다 성취도를 유의미하게 높이는 것으로 나타났습니다.
- 학습 방법에 따른 점수 차이가 공변인의 영향을 통제한 후에도 여전히 유의미합니다.
사후 검정:
- 그룹 간 비교에서, 새로운 학습 방법은 기존 방법보다 성취도를 유의미하게 높였습니다 (Mean Difference = -5.30, p = 0.000).
평균 비교: 새로운 방법 그룹의 평균 점수는 75.80점, 기존 방법 그룹은 70.50점으로, 약 5.30점의 차이가 있었습니다.
공분산 분석 결과, 새로운 학습 방법이 기존 학습 방법보다 학생들의 학업 성취도에 긍정적인 영향을 미치는 것으로 나타났습니다 (p < 0.05). 공변인(사전 점수)을 통제한 결과에서도 이러한 차이는 통계적으로 유의미했으며, 학습 방법의 효과 크기(ηp2 = 0.237)는 중간 수준 이상의 영향을 나타냅니다.
참고사항
표 작성 팁:
- 표는 APA 스타일을 준수하여 제목을 표 위에 배치하고, 단위나 약어를 설명합니다.
- 예: SS = Sum of Squares, df = degrees of freedom, MS = Mean Square, p = Probability Value.
해석 팁:
- F값과 p값을 중심으로 결과를 서술하고, 효과 크기(ηp2)를 포함하여 결과의 실질적 의미를 강조합니다.
- 사후 검정을 통해 그룹 간 차이를 구체적으로 설명합니다.
논문에서의 결과 작성 예시
연구 결과
본 연구는 새로운 학습 방법이 기존 학습 방법에 비해 학생들의 학업 성취도를 향상시키는지 검증하기 위해, 사전 점수(PreScore)를 공변인으로 투입한 공분산 분석(ANCOVA)을 실시하였다. 분석 결과, 공변인인 사전 점수의 효과가 유의하였으며, F(1,57)=13.60, p=.001, ηp2=.190으로 나타났다. 또한 공변인을 보정한 뒤에도 학습 방법(Group)의 주효과가 유의하였고, F(1,57)=17.75, p<.001, ηp2=.234로 확인되었다. 이는 학기초 수준을 통제한 이후에도 새로운 학습 방법이 학기말 성취도에 긍정적인 차이를 보인다는 점을 시사한다.
여기에 한 문장을 더한다면, “집단별 조정평균(estimated marginal means)을 비교한 결과, 새로운 방법 집단의 조정평균이 기존 방법 집단보다 높았다”
공분산 분석(ANCOVA)의 장점
ANCOVA의 장점은, 공변인의 영향을 보정하여 집단 효과를 더 “정확한 비교”로 제시할 수 있다는 점입니다. 또한 공변인이 설명하는 변동을 제거하면 오차가 줄어 검정력이 올라가는 효과가 있으며, 연구 설계에서 통제 변수를 적절히 포함함으로써 결과 해석의 설득력을 높일 수 있습니다.
주의할 점
반면 주의할 점도 분명합니다. 가장 중요한 것은 공변인과 종속변수의 관계가 선형이라는 점, 그리고 집단×공변인 상호작용이 유의하지 않아 공통 경사(동질적 회귀기울기) 가정이 충족되어야 한다는 점입니다. 또한 잔차의 등분산성과 정규성이 심각하게 위반되지 않아야 하며, 관측치의 독립성이 확보되어야 합니다. 그리고 해석의 관점에서는 공변인이 처치 이후에 변할 수 있는 변수라면 “통제”의 의미가 흔들릴 수 있으므로, 가능한 한 사전 측정 변수(예: 사전 점수)를 공변인으로 두는 것이 안전합니다. 이 부분을 짧게라도 언급해 두시면, 심사나 리뷰에서 “ANCOVA로 인과를 주장하려는 것 아니냐”는 오해를 예방하는 데 도움이 됩니다.

.png)
댓글 쓰기