Search
📘

[결과 요약 탭] 표본 오차, 3분 안에 완벽하게 알아가기

오늘의 주제
설문조사 결과를 분석할 때 표본오차가 중요한 이유는 무엇일까? #설문개요 #표본오차 #신뢰수준

Data Talk: 설문조사에서 빠질 수 없는 표본 오차, 쉽게 이해할 수는 없을까?

새미
안녕하세요, 새미입니다!
이번 Data Talk부터는 오픈애널리틱스의 결과 요약 탭 - 교차분석 탭 - 보고서 탭 3개의 탭을 하나씩 살펴보기로 기억합니다. 설문 데이터를 보는 방법을 A to Z로 배울 수 있다고 하니 설레네요!
오픈애널리틱스 팀(OA 팀)
새미, 반갑습니다.
맞아요, 이번 시간부터는 3개의 탭을 하나씩 톺아보는 시간을 가지려고 해요. 첫 번째는 결과 요약 탭을 살펴볼 거예요. 오픈애널틱스는 데이터를 잘 분석할 수 있도록 검토 - 분석 - 해석과 보고의 흐름을 가지고 구성되어 있어요.
결과 요약 탭은 문항별 결과를 볼 수 있는 검토를 위한 탭이에요. 이 탭에서 가장 먼저 보이는 것은 설문 개요 부분인데, 아래 문항 결과부터 살펴보느라 지나치기 쉬워요. 오늘은 설문 개요부터 천천히 알아보아요.
무선 이이폰 사용 조사
새미
설문 개요 부분을 쭉 살펴보니 설문에 응답한 사람 수, 문항 수, 표본 오차, 조사 기간 등을 개괄적으로 보여주는 역할을 하는 것 같네요.
OA 팀
네, 설문 개요는 설문에 대한 가장 기본적인 정보를 보여주는 란이에요. 대부분은 쉽게 이해할 수 있지만 가장 중요한 개념인 표본 오차는 그냥 넘어가는 경우가 많아요. 혹시 표본 오차가 무엇인지 알고 계신가요?
새미
표본 오차라…학창 시절 수학 시간에 배웠던 것 같은데 어떤 값이 얼마나 정확한지를 보여주는 오차 범위 정도로만 알고 있어요.
OA 팀
네, 맞아요. 더 풀어서 얘기하자면 설문조사에서 표본 오차는 설문 결과가 실제 전체 소비자들의 생각과 얼마나 가깝거나 다를 수 있는지 보여주는 지표예요.
이번 조사는 전국 18세 이상 남녀 1,000명 대상으로 진행되었으며, 95% 신뢰수준에서 표본오차는 ±3.1p%입니다.
선거 기간에 다음과 같은 뉴스를 접해본 적이 있을 거예요. 만약에 전 국민을 대상으로 조사를 하는 전수 조사를 했다면 설문 결과는 응답자의 생각이 100% 일치하겠지만, 전수 조사는 특수한 경우가 아니고서는 거의 불가능하기 때문에 국민 일부만을 추출해 조사하게 돼요. 따라서 조사 결과와 실제 전체 소비자들의 인식에는 차이가 생기기 마련이에요. 이 차이가 얼마나 나는지를 보여주는 것이 표본 오차예요.
새미
아하! 그러니까 전체 소비자 중에서 내가 추출해서 조사한 소비자의 응답이 전체 소비자를 얼마나 대변하는지를 숫자로 보여주는 셈이네요.  표본 오차가 작을수록 소비자를 더 대변하는 것이군요!
OA 팀
네, 맞아요.
아래 200% 알아가기에서 표본 오차를 결정하는 요소를 함께 살펴보아요.

표본 오차 200% 알아가기

결과 요약: 설문 데이터를 빠르게 검토할 수 있어요.

표본 오차는 언제 커지고 작아질까요?
앞서 언급한 것처럼 전체 소비자를 더 잘 대변할수록 표본 오차는 작아집니다. 따라서 응답자 수가 많을수록 표본 오차는 작아지고, 반대로 응답자 수가 적을수록 표본 오차는 커져요. 예를 들어 시장에 있는 A 제품 사용자를 대상으로 전수 조사를 했고 제품에 만족한다고 응답한 비율이 50%라면 이 결과가 곧 전체 소비자의 생각과 같습니다. 표본 오차가  ±0%p인 것이죠. 만약에 A 제품 사용자 1,000명만 추출해 응답을 받을 때 만족한다고 말한 비율이 50%라면 표본 오차가 ±3.1%p로 계산되기 때문에 A 제품에 만족하는 소비자 비율이 46.9%~53.1% 사이가 돼요. 반면 100명만을 대상으로 조사를 해서 만족한다고 답한 비율이 50%라면 표본 오차가 ±10%p가 되기 때문에 실제 전체 소비자 중에 A 제품을 만족하는 비율은 40%~60%가 됩니다.
무한정 응답자를 늘리는 건 아무래도 비용과 시간이 많이 들어요. 그렇다고 100명만을 대상으로 설문을 하면 표본 오차가 ±10%p...너무 크게 느껴집니다. 그래서 통상적으로 설문조사를 할 때 다음 원칙에 따라 응답자 수를 정할 수 있어요.
최소 400명: 성별/연령으로 집단을 나누지 않고 ‘전체 소비자’ 기준으로만 빠르게 결과를 봐야 할 때 (최대 표본 오차 ±4.9%p )
최소 1,000명: 성별/연령에 따라 응답의 차이가 있을 것 같아 집단을 나누어 결과를 봐야 할 때 (최대 표본 오차 ±3.1%p)
단, B2B나 해외 조사는 어떤 조사인지에 따라 원칙이 다를 수 있어 전문가에게 문의하는 것을 추천해요.

(심화 학습) 표본 오차와 신뢰 수준은 어떤 관계인가요?

표본 오차를 결정하는 것에는 두 가지가 있어요. 바로 응답자 수와 신뢰 수준인데요. 심화 학습에서는 신뢰 수준에 대해 알아갈 수 있어요. 표본 오차를 완전히 정복하고 싶다면 읽어보세요! (위 를 누르면 내용이 보입니다.)

데이터와 친해지기 퀴즈

더 많은 응답자에게 설문조사를 할수록 표본 오차는 작아진다. (O / X)

표본 오차가 클수록 전체 소비자의 생각을 대변하고 있다고 볼 수 있다. (O / X)

성별 혹은 연령별로 응답이 크게 차이가 날 것 같을 때도 100명만 조사를 해도 충분하다. (O / X)

누르고 정답 확인하기