jamovi로 첫 통계 분석! – 독립표본 t검정

– 직접 데이터 입력부터 결과 해석까지, 따라만 해도 통계 이해 끝!

통계를 처음 배우는 많은 분들이 “이걸 어디에 어떻게 써야 하지?” 하고 막막해하곤 합니다.

하지만 실제 데이터를 가지고, 분석을 하나씩 따라해 보면 훨씬 더 쉽고 재미있게 통계를 배울 수 있어요.
이번 글에서는 jamovi라는 통계 프로그램을 이용해 독립표본 t검정을 직접 실습해보겠습니다.

jamovi는 마우스 클릭만으로 분석이 가능하고, 분석 결과도 자동으로 보여줘서 통계 초보자에게 매우 좋은 도구입니다.
그럼 지금부터, 남학생과 여학생의 수학 점수 차이가 통계적으로 유의한지 확인해보는 분석을 시작해볼게요!

분석 시나리오

“남학생과 여학생의 수학 점수에 차이가 있을까?”

이 질문은 통계에서 매우 자주 등장하는 두 집단 평균 비교입니다. 두 집단이 서로 다른 사람들로 구성되어 있을 때(남학생 집단, 여학생 집단처럼) 사용하는 대표적인 방법이 독립표본 t검정입니다.

용어 정리

독립표본 t검정: 서로 다른 두 집단의 평균이 통계적으로 의미 있는 차이를 보이는지 확인하는 방법입니다.
예: 남학생 vs 여학생, 실험군 vs 통제군, A지역 vs B지역 등

Step 1. jamovi 실행 후 데이터 입력하기

jamovi를 실행하면 엑셀처럼 생긴 데이터 표가 나타납니다. 먼저 변수(열) 이름을 바꾸고, 아래 예제 데이터를 입력합니다.

* 빨간색 네모칸을 클릭하면 변수 이름을 바꿀수 있습니다. 데이터 변수 A를 성별, B를 수학점수로 변경합니다.

예제 데이터

성별	수학점수
남	85
여	78
남	90
여	72
남	88
여	76
남	91
여	74

입력 방

첫 번째 열 클릭 → 열 이름에 성별 입력
두 번째 열 클릭 → 열 이름에 수학점수 입력
각 셀에 데이터를 직접 입력

💡 jamovi는 보통 성별은 범주형(문자), 수학점수는 연속형(숫자)으로 자동 인식합니다. 그런데 가끔 인식이 꼬이면 Step 2에서 변수가 안 넘어갈 수 있으니, 그럴 때는 “변수 유형(측정 수준)”을 먼저 확인해 주세요.

Step 2. 독립표본 t검정 실행하기

이제 분석 메뉴에서 독립표본 t검정을 실행해보겠습니다.

상단 메뉴에서 [분석] 클릭
[T-테스트] → [독립표본 T검증] 클릭
오른쪽 설정 창에서 변수 배치
- 종속변수(수치): 수학점수
- 집단변수(범주): 성별

설정이 끝나면, 오른쪽 결과 창에 표가 자동 생성됩니다.

TIP) 변수가 종속변수 칸으로 안 넘어갈 때

수학점수가 “문자형”으로 잡혀 있을 가능성이 큽니다.
데이터 탭에서 해당 변수의 측정 수준을 연속형(Continuous)로 바꾼 뒤 다시 시도해 주세요.

Step 3. 결과 해석하기

jamovi 결과표는 깔끔하지만, 초보자에게는 “어느 칸을 먼저 봐야 하는지”가 더 중요합니다. 아래 순서대로만 보시면 됩니다.

📋 결과표에서 꼭 확인할 것(해석 순서)

각 집단의 평균(Mean)과 표준편차(SD), 표본 수(N)
Levene’s Test(등분산 가정 여부)
t, df, p(유의성 판단)
평균 차이(Mean difference)와 효과크기(Cohen’s d)(차이의 크기 판단)

📌 결과 화면 예시

📌 해석 예시(예제 데이터 기준)

남학생 평균: 88.5
여학생 평균: 75.0
평균 차이: 13.5점
p값: p < .001 수준으로 매우 작게 나옵니다(예제 데이터가 차이가 크게 설계되어 있습니다).

➡️ 결론: 남학생과 여학생의 수학 점수 평균은 통계적으로 유의한 차이가 있다고 해석할 수 있습니다.

p값이 0.05보다 작으면 → 유의한 차이가 있다고 판단
p값이 0.05보다 크면 → 유의한 차이가 있다고 보기 어렵다고 판단

🔎 t검정이 계산되는 핵심 구조(공식)

t값은 “평균 차이 ÷ 평균 차이의 불확실성(표준오차)”로 이해하시면 가장 직관적입니다.

\( t = \dfrac{\bar{x}_1 - \bar{x}_2}{SE(\bar{x}_1 - \bar{x}_2)} \)

보너스! Levene의 등분산 검정은 왜 보나?

독립표본 t검정은 두 집단의 분산이 비슷하다는 전제를 두고 계산되는 방식(Student’s t-test)이 기본입니다. 그런데 분산 차이가 크면 Student 방식이 부정확해질 수 있어서, 그때는 Welch’s t-test로 바꾸는 편이 안전합니다.

Levene’s Test p > 0.05 → 등분산 가정 가능 → Equal variances assumed 줄(또는 Student’s)을 중심으로 해석
Levene’s Test p < 0.05 → 등분산 가정이 어렵다 → Equal variances not assumed 줄(또는 Welch’s)을 중심으로 해석

jamovi는 등분산 여부를 같이 보여주기 때문에, 초보자도 결과 선택에서 크게 헷갈리지 않도록 구성되어 있습니다.

추가 설명(옵션이 헷갈릴 때 여기만 보시면 됩니다)

[검정] 항목

Student’s t-test
가장 일반적인 독립표본 t검정입니다. 등분산 가정이 크게 무리 없을 때(Levene p > 0.05) 기본 선택으로 충분합니다.
Welch’s t-test
등분산 가정이 어려울 때(Levene p < 0.05) 권장됩니다. 분산이 다른 상황에서 안정적으로 작동합니다.
Mann–Whitney U
정규성 가정이 매우 흔들리거나, 척도가 순위/서열에 가까워서 평균 비교가 부담스러울 때 고려하는 비모수 방법입니다.
베이즈 계수
베이지안 방식의 판단을 돕는 옵션입니다. 처음 학습 단계에서는 체크하지 않으셔도 흐름 이해에 문제가 없습니다.

[가설] 항목

집단 1 ≠ 집단 2 (양측검정)
방향을 미리 단정하지 않고 “차이가 있는가”를 묻습니다. 실무·연구에서 가장 많이 사용됩니다.
집단 1 > 집단 2 / 집단 1 < 집단 2 (단측검정)
사전 이론·근거로 방향이 명확할 때 사용합니다. 보고서에는 방향 설정의 근거를 함께 적는 편이 좋습니다.

대부분의 경우에는 양측검정(집단 1 ≠ 집단 2) 을 사용합니다. 사전에 명확한 방향성이 있다면 단측검정도 선택할 수 있어요.

[결측 값] 처리

대응별 결측값 제거(pairwise): 가능한 데이터를 최대한 살리되, 출력 표마다 N이 달라질 수 있습니다.
목록별 결측값 제거(listwise): 한 행에 결측이 있으면 그 행을 제외합니다. N이 일정해져 보고가 깔끔해지는 장점이 있습니다.

데이터 손실을 최소화하려면 기본값인 pairwise 방식을 추천합니다.

[추가 통계] 항목(체크 추천)

평균 차이(Mean difference): 실제 점수 차이를 숫자로 확인합니다. 해석에 도움이 됩니다.
효과 크기(Effect size, Cohen’s d): 유의성뿐 아니라 “차이가 얼마나 큰가”(실질적인 영향력) 평가합니다.
기술통계/도표: 집단별 평균·표준편차·표본수를 함께 보여줘서 결과 해석 시 매우 유용합니다.

[가정검증] 항목

동질성 검증 = 등분산 검정 (Levene's Test): 두 집단의 분산이 같은지 확인합니다. 분산이 다르면 Student's가 아니라 Welch's로 분석해야 합니다.
정규성 검: 데이터가 정규분포를 따르는지를 확인합니다. 비정규분포일 경우 비모수 검정(맨-휘트니 등)을 고려할 수 있습니다. 표본이 충분히 크면 영향이 줄어들지만, 표본이 작을수록 확인 가치가 커집니다.
Q–Q 도표: 데이터가 정규분포에 얼마나 근접한지를 시각적으로 보여주는 그래프로, 정규성에 대한 감을 시각적으로 잡을 수 있습니다.

자주 하는 실수(오류 해결)

수학점수가 종속변수로 안 들어감
수학점수 열이 문자형으로 잡혔을 가능성이 큽니다. 변수 측정 수준을 연속형(Continuous)로 변경해 주세요.
성별이 집단변수로 안 잡힘
성별 열이 연속형으로 잡혀 있을 수 있습니다. 측정 수준을 범주형(Nominal)로 바꿔 주세요.
p값만 보고 해석을 끝냄
평균 차이와 효과크기(Cohen’s d), 신뢰구간까지 함께 보면 보고서 품질이 확 달라집니다.
Levene 결과를 무시함
Levene p가 0.05 아래로 내려가면 Welch 결과를 중심으로 쓰는 편이 안전합니다.

보고서/논문 문장 템플릿(그대로 복붙)

1) 기본형(양측, Student 또는 Welch 공통)

독립표본 t검정을 실시한 결과, 남학생과 여학생의 수학 점수 평균은 통계적으로 유의한 차이를 보였습니다(t(df)=값, p=값). 남학생 평균은 M=값(SD=값), 여학생 평균은 M=값(SD=값)였습니다.

2) Levene 언급 포함형(보고서에서 깔끔하게 보입니다)

등분산성 가정을 확인하기 위해 Levene의 등분산 검정을 실시하였고(Levene p=값), 그 결과에 따라 Student(또는 Welch) 방식으로 독립표본 t검정을 해석하였습니다. 분석 결과, 두 집단 평균 차이는 유의했습니다(t(df)=값, p=값).

3) 효과크기까지 포함형(실무/학술에서 선호)

두 집단 평균 차이는 통계적으로 유의했으며(t(df)=값, p=값), 효과크기(Cohen’s d=값)를 고려할 때 차이의 크기도 함께 해석할 수 있습니다.

Step 4. 결과 저장하기

작업이 끝나면 파일을 저장해두면 재현과 공유가 쉬워집니다.

파일 > 저장 또는 다른 이름으로 저장
확장자 .omv로 저장(나중에 jamovi에서 그대로 이어서 작업 가능)
.csv로 내보내면 Excel에서도 활용 가능

FAQ

Q1. p값이 0.05보다 작으면 무조건 의미가 큰가요?

p값은 “우연으로 보기 어려운가”를 말해줍니다. 실제 차이가 큰지(실질적 의미)는 평균 차이, 효과크기, 신뢰구간까지 함께 보셔야 판단이 정확해집니다.

Q2. p값이 0.05보다 크면 차이가 없다고 말해도 되나요?

대부분의 경우 “유의한 차이를 확인하기 어렵다” 정도로 표현하는 편이 안전합니다. 표본 수가 작으면 차이가 있어도 검정력이 부족해 유의성이 안 나올 수 있습니다.

Q3. Student와 Welch 중 무엇을 기본으로 쓰면 좋을까요?

Levene 결과가 문제 없으면 Student를 써도 충분합니다. 다만 분산 차이가 걱정되는 데이터라면 Welch를 쓰는 쪽이 더 안정적입니다. jamovi는 둘 다 보여주므로, Levene 기준으로 선택해주시면 됩니다.