샘플이 있을 수 있습니다. 인구 및 표본. 샘플 유형. 표본 및 모집단

샘플링의 개념.

4강

1. 샘플링의 개념. 2. 시료의 종류 및 시료의 구성방법3. 표본 크기 결정.

인구– 특성에 필수적인 몇 가지 공통 속성을 가진 모든 요소의 집합입니다. 샘플링은 연구자가 관심을 갖는 모든 소비자의 목록으로 이해되는 일반 모집단의 개요에 대한 지식을 기반으로 합니다. 예를 들어 특정 지역이나 도시의 모든 주택 소유자 목록 또는 제품을 판매하는 모든 소매점 목록이 있습니다.

모집단의 규모와 연구 목적에 따라 방법을 사용할 수 있습니다. 마디 없는또는 선택적시험. 지휘할 때 마디 없는설문 조사는 인구의 모든 단위를 조사합니다. 이 방법은 모집단의 요소 수가 적은 경우(소비자 조사의 VIP 클라이언트, B2B 조사의 조직)에 사용할 수 있습니다.

마케팅 조사에서 데이터를 얻는 가장 일반적인 방법은 다음과 같습니다. 선택적관찰. 표본 모집단에서 단위를 선택하기 위한 특정 규칙을 준수하고 표본의 대표성을 준수하면 표본 데이터가 일반 모집단으로 확장될 수 있습니다.

샘플을 만들 때 우리는 다음을 사용합니다. 확률적인 그리고 비확률적 (결정론적) 방법.

확률표본은 연구대상의 각 요소를 일정한 확률로 포함시킬 수 있는 표본이다. 확률표본에서는 모집단의 각 요소가 알려져 있으며 설문조사에 포함될 확률이 일정합니다. 인구 규모에 대한 정보가 부족하여 정확한 확률 계산이 불가능하다는 점에 유의해야 합니다. 따라서 "확실한 확률"이라는 용어는 모집단의 정확한 크기에 대한 지식보다는 샘플링 규칙과 더 관련이 있습니다.

비확률 표본추출은 미리 정해진 선호나 판단에 따라 항목을 선택하는 표본입니다. 안에 비확률 표본표본에 포함되는 모집단의 각 객체가 동일한 확률이라는 조건이 충족되지 않습니다. 을 위한 이 유형샘플링 오류(바이어스)를 계산할 수 없습니다. 그러나 이것이 연구가 부정확한 결과를 낳는다는 것을 의미하지는 않습니다. 비확률 샘플링에는 시간과 비용이 덜 필요합니다. 비확률 표본은 상대적으로 작은 모집단(수천, 수만 명의 소비자)에 사용되는 경우가 많습니다.

다음과 같은 유형의 결정론적 샘플이 구별됩니다.

· 대표성이 없다;

· 의도적;

· 할당량;

· 메인 어레이.

비대표성(편의 샘플링) 샘플은 가장 접근하기 쉬운 요소(상점의 고객, 거리의 행인 등)의 선택을 기반으로 합니다. 연구자는 응답자가 예상 인구에 속한다는 원칙을 따릅니다.

판단적 샘플링은 연구자의 의견에 따라 연구 목적을 충족하는 요소를 수동으로 선택하는 것을 기반으로 합니다. 목적 샘플링의 변형은 눈덩이 샘플링입니다. 이는 초기 요소를 식별하는 것으로 구성되며, 각 요소는 여러 가지 새로운 요소를 가리킵니다. 이러한 표본은 전체 유사한 개체 집합에서 작은 비율을 차지하고 서로 밀접하게 상호 작용하는 특정 특성을 가진 개체를 검사할 때 사용됩니다. 목적이 있는 샘플링에는 비대표성 샘플링과 마찬가지로 오류를 추정할 수 없고 대표성이 낮다는 주요 단점이 있습니다.

할당량 샘플링 - 할당량 샘플링 - 연구 중인 일반 모집단에 존재하는 주요 특성에 따라 동일한 비율로 표본의 요소를 포함하여 형성된 결정론적 표본

가장 널리 사용되는 샘플링 방법 중 하나입니다. 할당량 방법을 사용하는 경우 샘플을 제어할 하나 이상의 특성이 선택됩니다. 특정 특성을 갖는 표본의 단위 수는 모집단의 해당 단위 수에 비례해야 합니다. 할당량 방법을 사용할 때 무작위 표본 추출보다 더 작은 표본 크기를 취하는 것이 가능하다고 믿어집니다. 할당량 표본 추출은 주어진 매개변수에 따라 표본과 일반 모집단의 거의 완전한 일치를 제공하기 때문입니다. 샘플의 대표성(대표성) 속성이 관찰됩니다. 그러나 이 진술은 수학적 방법으로는 확인할 수 없습니다. 대부분의 경우 사회 인구학적 특성(성별, 연령, 교육, 소득 수준 등)이 할당 매개변수로 사용됩니다.

방법 메인 어레이 일반 인구 개체의 50% 이상이 표본에 포함된다고 가정합니다. 설문조사의 장점 기본 배열 방법표본이 모집단에서 차지하는 비율이 높다는 것입니다. 이로 인해 발생할 수 있는 오류를 제거하는 것이 가능합니다. 원칙적으로는 일반 모집단에서 많은 비율의 응답자를 조사하는 것으로 충분하며, 이는 표본 평균과 일반 평균의 차이를 최소화합니다.

확률적 방법.표본 추출 단위가 표본에 포함될 확률(확률)이 알려진 경우 해당 표본을 확률 표본이라고 합니다. 확률적 방법에는 다음이 포함됩니다.

· 단순 무작위 선택;

· 체계적인 선택;

· 클러스터 선택;

· 계층화된 선택.

단순임의추출(SRS) – 연구 대상의 각 요소가 표본 모집단에 포함될 확률이 동일한 표본으로, 확률 표본을 구성하는 가장 간단한 방법입니다. 이러한 샘플은 전체 목록에서 동일한 확률로 요소를 무작위로 선택하여 구성됩니다. 이러한 표본의 가장 큰 단점은 연구 대상 인구의 전체 요소 목록이 필요하다는 것입니다. , 이는 마케팅 조사 실무에서 매우 드물게 제공됩니다. 단순임의표본의 경우 일반 모집단의 전체 단위 질량을 먼저 어떤 그룹으로 나누지 않고 선택하며, 각 요소는 표본에 포함될 확률(P)이 동일하며 이는 다음과 같이 계산할 수 있습니다. 일반 모집단의 크기에 대한 표본 크기의 비율입니다. 예를 들어 모집단 규모가 10,000,000명이고 표본 크기가 600명이라면 특정 인물이 표본에 포함될 확률은 6%(400/10,000 * 100)입니다. 무작위 표본을 구성하는 가장 간단한 방법은 제비를 뽑거나 난수표를 사용하는 것입니다. 전화 인터뷰 중에 컴퓨터에는 난수 생성 기능이 있기 때문에 무작위로 전화번호를 생성할 수 있습니다.

견본

견본또는 표본 모집단- 특정 절차를 사용하여 연구에 참여하기 위해 일반 모집단에서 선택한 일련의 사례(주제, 객체, 이벤트, 샘플)입니다.

샘플 특성:

샘플의 질적 특성 - 우리가 정확히 누구를 선택하고 이를 위해 어떤 샘플링 방법을 사용하는지.
표본의 정량적 특성 - 선택한 사례 수, 즉 표본 크기입니다.

샘플링의 필요성

연구 대상은 매우 광범위합니다. 예를 들어, 글로벌 기업 제품의 소비자는 지리적으로 분산된 수많은 시장으로 대표됩니다.
기본적인 정보를 수집할 필요가 있습니다.

표본의 크기

표본의 크기- 표본 모집단에 포함된 사례 수. 통계적인 이유로 사례 수는 최소 30~35개 이상인 것이 좋습니다.

종속 및 독립 표본

두 개 이상의 샘플을 비교할 때 중요한 매개변수는 종속성입니다. 두 표본의 각 사례에 대해 동형 쌍이 확립될 수 있는 경우(즉, 표본 X의 한 사례가 표본 Y의 단 하나의 사례에 해당하고 그 반대인 경우)(그리고 이러한 관계의 기초는 측정되는 특성에 중요합니다) 샘플에서) 이러한 샘플을 호출합니다. 매달린. 종속 표본의 예:

쌍둥이 한 쌍,
실험 노출 전후의 특성에 대한 두 가지 측정,
남편과 아내
등등.

샘플 간에 그러한 관계가 없으면 이러한 샘플이 고려됩니다. 독립적인, 예를 들어:

따라서 종속 표본의 크기는 항상 동일하지만 독립 표본의 크기는 다를 수 있습니다.

샘플 비교는 다양한 통계 기준을 사용하여 이루어집니다.

등등

대표성

표본은 대표성 또는 비대표성으로 간주될 수 있습니다.

대표성이 없는 표본의 예

서로 다른 조건에 배치된 실험군과 대조군을 대상으로 한 연구입니다.
- 쌍별 선택 전략을 사용하여 실험군과 대조군을 대상으로 연구
단 하나의 그룹, 즉 실험 그룹만을 사용한 연구입니다.
혼합(요인) 설계를 사용한 연구 - 모든 그룹이 서로 다른 조건에 배치됩니다.

샘플링 유형

샘플은 두 가지 유형으로 나뉩니다.

확률적인
비확률적

확률 샘플

단순 확률 샘플링:
- 간단한 리샘플링. 이러한 표본의 사용은 각 응답자가 표본에 포함될 가능성이 동일하다는 가정에 기초합니다. 일반 인구 목록을 기반으로 응답자 번호가 적힌 카드가 작성됩니다. 카드를 덱에 넣고 섞은 후 무작위로 카드를 꺼낸 다음 숫자를 기록한 다음 다시 반환합니다. 다음으로, 필요한 표본 크기만큼 절차가 반복됩니다. 단점: 선택 단위가 반복됩니다.

단순 무작위 표본을 구성하는 절차에는 다음 단계가 포함됩니다.

1. 전체 인구 목록을 확보하고 이 목록에 번호를 매길 필요가 있습니다. 이러한 목록, 즉 회상을 샘플링 프레임이라고 합니다.

2. 예상 표본 크기, 즉 예상 응답자 수를 결정합니다.

3. 난수표에서 필요한 샘플 단위만큼의 숫자를 추출합니다. 표본에 100명이 있어야 한다면 테이블에서 무작위로 100개의 숫자를 가져옵니다. 이러한 난수는 컴퓨터 프로그램에 의해 생성될 수 있습니다.

4. 숫자가 기록된 난수에 해당하는 관측치를 기본 목록에서 선택합니다.

단순 무작위 샘플링에는 분명한 이점이 있습니다. 이 방법은 이해하기 매우 쉽습니다. 연구 결과는 연구 대상 인구 집단에 일반화될 수 있습니다. 통계적 추론에 대한 대부분의 접근 방식에는 단순 무작위 표본을 사용하여 정보를 수집하는 작업이 포함됩니다. 그러나 단순 무작위 샘플링 방법에는 최소한 네 가지 중요한 제한 사항이 있습니다.

1. 단순 무작위 샘플링을 허용하는 샘플링 프레임을 만드는 것이 어려운 경우가 많습니다.

2. 단순 무작위 샘플링으로 인해 인구가 많아지거나 지리적으로 넓은 지역에 인구가 분산되어 데이터 수집 시간과 비용이 크게 증가할 수 있습니다.

3. 단순임의추출법의 결과는 다른 확률법의 결과에 비해 정밀도가 낮고 표준오차가 더 큰 특징을 갖는 경우가 많습니다.

4. SRS를 활용한 결과, 비대표표본이 형성될 수 있다. 단순 무작위 표본 추출로 얻은 표본은 평균적으로 모집단을 적절하게 대표하지만 일부는 연구 대상 모집단을 극도로 잘못 대표합니다. 특히 표본 크기가 작을 때 이런 현상이 발생할 가능성이 높습니다.

단순 비반복 샘플링. 샘플링 절차는 동일하며 응답자 번호가 있는 카드만 덱으로 반환되지 않습니다.

체계적인 확률 샘플링. 이는 단순 확률 샘플링의 단순화된 버전입니다. 일반 인구 목록을 기준으로 일정 간격(K)을 두고 응답자를 선정합니다. K 값은 무작위로 결정됩니다. 가장 신뢰할 수 있는 결과는 균일한 모집단에서 달성됩니다. 그렇지 않으면 샘플의 단계 크기와 일부 내부 순환 패턴이 일치할 수 있습니다(샘플링 혼합). 단점: 단순 확률 표본과 동일합니다.
직렬(클러스터) 샘플링. 선발 단위는 통계 계열(가족, 학교, 팀 등)입니다. 선택한 요소는 완전한 검사를 받습니다. 통계 단위의 선택은 무작위 또는 체계적 샘플링으로 구성될 수 있습니다. 단점: 일반 인구에 비해 동질성이 더 클 가능성이 있습니다.
지역 샘플링. 이질적인 모집단의 경우 선택 기술과 함께 확률 샘플링을 사용하기 전에 모집단을 동질적인 부분으로 나누는 것이 좋습니다. 이러한 샘플을 구역 샘플링이라고 합니다. 구역 설정 그룹에는 자연 지형(예: 도시 지역)과 연구의 기초를 형성하는 모든 기능이 모두 포함될 수 있습니다. 분할이 수행되는 특성을 계층화 및 구역화의 특성이라고합니다.
"편의성" 샘플. "편리한" 샘플링 절차는 "편리한" 샘플링 단위(학생 그룹, 스포츠 팀, 친구 및 이웃)와의 접촉을 설정하는 것으로 구성됩니다. 새로운 개념에 대한 사람들의 반응에 대한 정보를 얻으려면 이러한 유형의 샘플링이 매우 합리적입니다. 편의 샘플링은 종종 설문지를 사전 테스트하는 데 사용됩니다.

비확률 표본

이러한 표본의 선택은 무작위성의 원칙에 따르지 않고 주관적인 기준(가용성, 전형성, 평등한 표현 등)에 따라 수행됩니다.

할당량 샘플링 - 표본은 연구 대상 특성의 할당량(비율) 형태로 일반 모집단의 구조를 재현하는 모델로 구성됩니다. 연구된 특성의 다양한 조합을 가진 표본 요소의 수는 일반 모집단에서 해당 요소의 비율(비율)에 해당하도록 결정됩니다. 예를 들어, 일반 인구가 5,000명으로 구성되어 있고 그 중 2,000명이 여성이고 3,000명이 남성이라면 할당량 샘플에는 여성 20명, 남성 30명, 즉 여성 200명과 남성 300명이 있습니다. 할당량 샘플은 성별, 연령, 지역, 소득, 교육 등 인구통계학적 기준을 기반으로 하는 경우가 가장 많습니다. 단점: 일반적으로 이러한 샘플은 대표성이 없습니다. 한 번에 여러 사회적 매개변수를 고려하는 것은 불가능합니다. 장점: 쉽게 구할 수 있는 재료.
눈덩이 방식. 샘플은 다음과 같이 구성됩니다. 첫 번째 응답자부터 각 응답자에게 선택 조건에 적합하고 연구에 참여할 수 있는 친구, 동료, 지인의 연락처 정보를 요청합니다. 따라서 첫 번째 단계를 제외하고는 연구 대상자 스스로가 참여하여 표본이 형성된다. 이 방법은 접근이 어려운 응답자 그룹(예: 고소득 응답자, 동일한 직업군에 속한 응답자, 비슷한 취미/관심사를 가진 응답자 등)을 찾아 인터뷰해야 할 때 자주 사용됩니다.
자발적인 샘플링 - 소위 "처음 만나는 사람"의 샘플링입니다. 텔레비전이나 라디오 여론조사에서 자주 사용됩니다. 자발적 표본의 크기와 구성은 사전에 알려지지 않았으며 응답자의 활동이라는 하나의 매개변수에 의해서만 결정됩니다. 단점: 응답자가 어떤 인구를 대표하는지 파악하는 것이 불가능하며 결과적으로 대표성을 판단하는 것이 불가능합니다.
경로 조사 – 학습 단위가 가족일 때 자주 사용됩니다. 조사가 수행될 지역의 지도에는 모든 거리에 번호가 표시되어 있습니다. 난수 테이블(생성기)을 사용하여 큰 숫자가 선택됩니다. 각 큰 숫자는 거리 번호(첫 번째 숫자 2~3개), 집 번호, 아파트 번호의 3가지 구성 요소로 구성된 것으로 간주됩니다. 예를 들어, 숫자 14832: 14는 지도의 거리 번호, 8은 집 번호, 32는 아파트 호수입니다.
전형적인 개체를 선택하여 지역 샘플링. 구역화 후 각 그룹에서 일반적인 개체를 선택한 경우, 즉 연구에서 연구된 대부분의 특성 측면에서 평균에 가까운 개체, 이러한 샘플을 전형적인 개체를 선택하여 지역화라고 합니다.

6. 모달 샘플링. 7. 전문가 샘플링. 8. 이종 샘플.

그룹 구축 전략

심리 실험에 참여할 그룹의 선택은 내부 및 외부 타당성이 최대한 유지되도록 다양한 전략을 사용하여 수행됩니다.

무작위화

무작위화, 또는 무작위 선택, 단순 무작위 샘플을 생성하는 데 사용됩니다. 이러한 표본의 사용은 모집단의 각 구성원이 표본에 포함될 가능성이 동일하다는 가정에 기초합니다. 예를 들어, 100명의 대학생을 무작위로 추출하려면 모든 대학생의 이름이 적힌 종이를 모자에 넣은 다음 그 중에서 100개의 종이를 꺼내면 무작위 선택이 됩니다(Goodwin J ., p. 147).

쌍별 선택

쌍별 선택- 피험자 그룹이 실험에 중요한 2차 매개변수 측면에서 동등한 피험자로 구성되는 샘플링 그룹을 구성하기 위한 전략입니다. 이 전략은 실험군과 대조군을 사용하는 실험에 효과적이며, 가장 좋은 옵션은 쌍둥이 쌍(단일 및 이란성)을 참여시키는 것입니다.

계층적 선택

계층적 선택- 계층(또는 클러스터) 할당을 통한 무작위화. 이 표본추출 방법을 통해 일반 인구를 특정 특성(성별, 연령, 정치적 선호, 교육 수준, 소득 수준 등)을 가진 그룹(계층)으로 나누고 해당 특성을 가진 대상을 선택합니다.

대략적인 모델링

대략적인 모델링- 제한된 표본을 추출하고 이 표본에 대한 결론을 더 넓은 모집단에 일반화합니다. 예를 들어, 본 연구에 대학생 2학년이 참여하여 본 연구의 데이터는 '17~21세'를 대상으로 한다. 그러한 일반화의 허용 가능성은 극히 제한적입니다.

근사 모델링은 명확하게 정의된 시스템(프로세스) 클래스에 대해 해당 동작(또는 원하는 현상)을 허용 가능한 정확도로 설명하는 모델을 형성하는 것입니다.

노트

문학

나슬레도프 A.D.심리학 연구의 수학적 방법. - 상트페테르부르크: Rech, 2004.

Ilyasov F.N. 마케팅 조사에서 설문조사 결과의 대표성 // 사회학 연구. 2011. No. 3. P. 112-116.

또한보십시오

일부 유형의 연구에서는 샘플이 다음과 같은 그룹으로 나뉩니다.
- 실험적인
- 제어
보병대

연결

샘플링의 개념. 샘플의 주요 특징. 샘플링 유형

위키미디어 재단. 2010.

동의어:

다른 사전에 "선택"이 무엇인지 확인하십시오.

견본- 특정 모집단을 대표하고 실험이나 연구를 위해 선택된 피험자 그룹입니다. 그 반대 개념은 일반적인 총체성(general totality)이다. 표본은 일반 모집단의 일부입니다. 실용적인 심리학자의 사전. M.: AST,... ... 훌륭한 심리학 백과사전

견본- 표본 관찰에 포함되는 요소의 일반 모집단 부분(종종 표본 모집단이라고 하며 표본은 관찰 자체를 샘플링하는 방법입니다). 수학적 통계에서는 이것이 허용됩니다... ... 기술 번역가 가이드

- (예시) 1. 전체 수량을 대표하기 위해 선택한 소량의 제품입니다. 참조: 샘플별 판매. 2. 잠재 구매자에게 소량의 상품을 제공하여 실행 기회를 제공합니다... ... 비즈니스 용어 사전

견본- 관찰에 포함되는 요소의 일반 모집단의 일부(종종 표본 모집단이라고 하며 표본은 관찰 자체를 샘플링하는 방법입니다). 수학적 통계에서는 무작위 선택의 원칙이 채택됩니다. 이것… … 경제 및 수학 사전

- (샘플) 주요 모집단에서 요소의 하위 그룹을 무작위로 선택하며, 그 특성은 전체 모집단을 전체적으로 평가하는 데 사용됩니다. 표본 추출 방법은 전체 인구를 대상으로 조사하기에는 시간이 너무 많이 걸리거나 비용이 많이 드는 경우에 사용됩니다. 경제사전

표본(Sample) - 연구에 참여하기 위해 일반 모집단 중에서 특정 절차를 사용하여 선택된 일련의 사례(주체, 대상, 사건, 표본)입니다.

표본의 크기

표본 크기는 표본 모집단에 포함된 사례 수입니다. 통계적인 이유로 사례 수는 최소 30~35개 이상인 것이 좋습니다.

종속 및 독립 표본

두 개 이상의 샘플을 비교할 때 중요한 매개변수는 종속성입니다. 두 표본의 각 사례에 대해 동형 쌍(즉, 표본 X의 한 사례가 표본 Y의 하나의 사례에 해당하고 그 반대인 경우)을 설정할 수 있는 경우(그리고 이 관계의 기초는 다음과 같은 경우에 중요합니다. 특성이 표본에서 측정되는 경우) 이러한 표본을 종속 표본이라고 합니다. 종속 표본의 예:

쌍둥이 한 쌍,
실험 노출 전후의 특성에 대한 두 가지 측정,
남편과 아내
등등.

샘플 간에 그러한 관계가 없으면 이러한 샘플은 독립적인 것으로 간주됩니다. 예를 들면 다음과 같습니다.

남자와 여자,
심리학자와 수학자.
따라서 종속 표본의 크기는 항상 동일하지만 독립 표본의 크기는 다를 수 있습니다.

샘플 비교는 다양한 통계 기준을 사용하여 이루어집니다.

학생의 t- 테스트
윌콕슨 T-검정
Mann-Whitney U 테스트
서명 기준
등등

대표성

표본은 대표성 또는 비대표성으로 간주될 수 있습니다.

대표성이 없는 표본의 예

미국에서는 대표성이 없는 표본 추출의 가장 유명한 역사적 사례 중 하나가 1936년 대통령 선거에서 발생합니다. 이전 여러 선거의 사건을 성공적으로 예측했던 Literary Digest는 구독자, 전국 전화번호부에서 선정된 사람들, 자동차 등록 목록에서 선정된 사람들에게 천만 장의 시험 투표용지를 발송했을 때 예측이 틀렸습니다. 반환된 투표지의 25%(거의 250만 개)에서 투표는 다음과 같이 분배되었습니다.

57%가 선호하는 공화당 후보 Alf Landon

40%가 당시 민주당 대통령이었던 프랭클린 루즈벨트를 선택했습니다.

알려진 바와 같이 실제 선거에서 루즈벨트는 60% 이상의 득표율을 얻어 승리했습니다. Literary Digest의 실수는 다음과 같습니다. 표본의 대표성을 높이고자 - 대부분의 구독자가 자신을 공화당원으로 간주한다는 것을 알고 있었기 때문에 - 전화번호부 및 등록 목록에서 선택한 사람들을 포함하도록 표본을 확장했습니다. 그러나 그들은 시대의 현실을 고려하지 않았고 실제로 더 많은 공화당 원을 모집했습니다. 대공황 동안 전화기와 자동차를 소유할 여유가 있었던 것은 주로 중산층과 상류층의 대표자들이었습니다(즉, 대부분의 공화당원들) , 민주당이 아닙니다).

샘플로부터 그룹을 구성하기 위한 계획 유형

그룹 구축 계획에는 몇 가지 주요 유형이 있습니다.

서로 다른 조건에 배치된 실험군과 대조군을 대상으로 한 연구입니다.
쌍별 선택 전략을 사용하여 실험군과 대조군을 대상으로 연구
단 하나의 그룹, 즉 실험 그룹만을 사용한 연구입니다.
혼합(요인) 설계를 사용한 연구 - 모든 그룹이 서로 다른 조건에 배치됩니다.

그룹 구축 전략

심리 실험에 참여할 그룹 선택은 내부 및 외부 타당성을 최대한 존중하기 위해 다양한 전략을 사용하여 수행됩니다.

무작위화(무작위 선택)
실제 그룹 유치

무작위화

무작위화, 또는 무작위 선택, 단순 무작위 샘플을 생성하는 데 사용됩니다. 이러한 표본의 사용은 모집단의 각 구성원이 표본에 포함될 가능성이 동일하다는 가정에 기초합니다. 예를 들어, 100명의 학생을 무작위로 표본 추출하려면 모든 대학생의 이름이 적힌 종이 조각을 모자에 넣은 다음 그 중에서 100개의 종이를 꺼내면 무작위 선택이 됩니다(Goodwin J. , 147쪽).

쌍별 선택

쌍별 선택- 피험자 그룹이 실험에 중요한 2차 매개변수 측면에서 동등한 피험자로 구성되는 샘플링 그룹을 구성하기 위한 전략입니다. 이 전략은 실험군과 대조군을 사용하는 실험에 효과적이며 최선의 선택은 참여하는 것입니다.

학습 목표

인구조사(자격)와 표본추출의 개념을 명확하게 구분하세요.
표본 모집단을 얻기 위해 연구자가 구현하는 6단계의 본질과 순서를 알아보세요.
"샘플링 프레임"의 개념을 정의합니다.
확률과 결정론적 샘플링의 차이점을 설명하세요.
고정 크기 샘플링과 다단계(순차) 샘플링을 구별합니다.
목적적 샘플링이 무엇인지 설명하고 장점과 단점을 모두 설명합니다.
할당량 샘플링의 개념을 정의합니다.
샘플링 절차에서 매개변수가 무엇인지 설명하세요.
파생집합이 무엇인지 설명해보세요.
표본분포의 개념이 통계학에서 왜 필수적인 개념인지 설명하시오.

그래서 연구자는 문제를 정확하게 정의하고, 이를 해결하는데 적합한 연구 설계와 데이터 수집 도구를 확보했습니다. 연구 과정의 다음 단계는 조사할 요소를 선택하는 것입니다. 해당 인구에 대한 전체 인구 조사를 수행하여 특정 인구의 모든 요소를 조사하는 것이 가능합니다. 인구에 대한 완전한 조사를 인구 조사라고 합니다. 또 다른 가능성이 있습니다. 대규모 그룹의 요소 샘플인 인구의 특정 부분에 대해 통계 조사가 실시되고, 이 하위 집합에서 얻은 데이터를 기반으로 전체 그룹에 대한 특정 결론이 도출됩니다. 표본 데이터에서 얻은 결과를 더 큰 그룹으로 일반화할 수 있는 가능성은 표본을 수집한 방법에 따라 달라집니다. 이 장의 대부분은 샘플을 선택하는 방법과 선택해야 하는 이유에 대해 설명합니다.

인구조사(자격)
인구 조사를 완료하세요.
견본
더 큰 개체 그룹의 하위 집합 요소 모음입니다.

"인구" 또는 "수집"이라는 개념은 사람뿐만 아니라 제조업에 종사하는 기업, 소매 또는 도매 조직, 심지어는 기업에서 생산되는 부품과 같은 완전히 무생물을 의미할 수도 있습니다. 이 개념은 특정 특정 조건을 만족하는 요소의 전체 집합으로 정의됩니다. 이러한 조건은 대상 그룹에 속하는 요소와 고려에서 제외되어야 하는 요소를 모두 명확하게 정의합니다.

냉동 피자 소비자의 인구통계학적 프로필을 결정하기 위한 연구는 누가 분류되어야 하는지와 분류되어서는 안 되는지 식별하는 것부터 시작해야 합니다. 이 피자를 한 번 이상 먹어본 사람들이 이 카테고리에 속합니까? 한 달에 피자 한 개 이상을 구매하는 개인은 누구입니까? 주에? 한달에 피자를 일정량 이상 먹는 사람들은? 연구자는 대상 그룹을 매우 정확하게 식별해야 합니다. 또한 샘플링 프레임이 부적절하거나 불완전한 경우인 "일부" 모집단이 아닌 대상 모집단에서 표본을 추출해야 합니다. 후자는 실제 샘플이 형성되는 요소 목록입니다.

연구자는 여러 가지 이유로 전체 모집단에 대한 조사보다 표본 방법을 선호할 수 있습니다. 첫째, 상대적으로 작은 규모의 인구에 대한 완전한 조사에는 매우 많은 재료 및 시간 비용이 필요합니다. 인구 조사가 완료되고 데이터가 처리될 때쯤에는 해당 정보가 이미 오래된 정보인 경우가 많습니다. 어떤 경우에는 자격이 단순히 불가능합니다. 연구원들이 전기 백열등의 실제 사용 수명이 계산된 수명과 일치하는지 확인하기 시작했다고 가정해 보겠습니다. 이를 위해서는 백열등이 고장날 때까지 계속 켜져 있어야 합니다. 이런 식으로 램프 재고 전체를 조사하면 신뢰할만한 데이터를 얻을 수 있지만 거래할 것이 남지 않습니다.

마지막으로, 초보자가 놀랍게도 연구자는 결과의 정확성을 보장하기 위해 검열보다 샘플링을 선호할 수 있습니다. 인구조사를 수행하려면 대규모 직원이 참여해야 하며, 이는 체계적(비표본) 오류 가능성을 높입니다. 이 사실은 미국 인구조사국이 다양한 유형의 인구조사의 정확성을 확인하기 위해 표본 조사를 사용하는 이유 중 하나입니다. 들으셨다시피 자격 데이터의 정확성을 확인하기 위해 샘플 설문조사가 실시될 수 있습니다.

샘플 설계 단계

그림에서. 그림 15.1은 표본 연구자가 따를 수 있는 6단계 순서를 보여줍니다. 우선, 연구자가 알고 싶어하는 대상 모집단이나 요소 집합을 결정하는 것이 필요합니다.

예를 들어, 어린이의 선호도를 연구할 때 연구자는 연구 대상 인구가 어린이로만 구성될지, 부모로만 구성될지, 아니면 둘 다로 구성될지 결정해야 합니다.

집계 (인구)
지정된 특정 조건을 만족하는 요소 집합입니다.
샘플링 프레임
샘플을 만들 요소 목록 영토 단위, 조직, 개인 및 기타 요소로 구성될 수 있습니다.

어떤 회사에서는 어린이들에게만 자사의 전기 "경주"를 테스트했습니다. 그들은 아이들을 기쁘게 했습니다. 부모들은 신제품에 다르게 반응했습니다. 엄마들은 어트랙션이 아이들에게 자동차 관리법을 가르쳐주지 않는다는 점을 좋아하지 않았고, 아빠들은 제품이 장난감처럼 만들어진 점을 좋아하지 않았습니다.
반대 상황도 가능합니다. 어떤 회사에서는 새로운 식품을 만들기 시작하여 조숙한 아이를 주인공으로 하는 전국 광고 캠페인을 벌였고, 기뻐하는 엄마들만을 대상으로 광고의 효과를 테스트했습니다. 아이들은 이 "가속기"와 광고된 제품 자체가 역겹다고 생각했습니다. 1. 제품이 완성되었습니다.

연구자는 관련 모집단이 개인, 가족, 기업, 기타 조직, 신용카드 거래 등으로 누구 또는 무엇으로 구성될 것인지 결정해야 합니다. 그러한 결정을 내릴 때 모집단에서 제외되어야 하는 요소를 결정하는 것이 필요합니다. 요소에 대한 시간적, 지리적 참조가 모두 수행되어야 하며 경우에 따라 추가 조건이나 제한이 적용될 수 있습니다. 예를 들어 개인에 대해 이야기하는 경우 관심 모집단은 18세 이상의 사람으로만 구성되거나 여성으로만 구성되거나 최소한 고등학교 교육을 받은 사람으로만 구성될 수 있습니다.

국제 마케팅 연구에서 대상 인구에 대한 지리적 경계를 정의하는 작업은 고려 중인 시스템의 이질성을 증가시키기 때문에 특히 어려울 수 있습니다. 예를 들어, 도시와 농촌의 상대적 비율은 국가마다 크게 다를 수 있습니다. 영토적 측면은 한 국가 내 인구 구성에 심각한 영향을 미칩니다. 예를 들어, 칠레 북부에는 주로 인도인 인구가 밀집되어 살고 있는 반면, 칠레 남부 지역에는 주로 유럽인의 후손들이 살고 있습니다.

적용범위(발생건수)
표본에 포함하기 위한 조건을 충족하는 모집단 또는 그룹 요소의 비율을 백분율로 표시합니다.

일반적으로 말하면 대상 모집단이 더 간단하게 정의될수록 적용 범위(발생률)가 높아지고 샘플링 절차가 더 쉽고 저렴해집니다. 적용범위(발생건수)표본에 포함하기 위한 조건을 충족하는 모집단 또는 그룹 요소의 비율에 해당합니다. 적용 범위는 설문 조사를 수행하는 데 필요한 시간과 재료 비용에 직접적인 영향을 미칩니다. 적용 범위가 넓다면(즉, 모집단의 많은 요소가 잠재적인 응답자를 식별하는 데 사용되는 하나 이상의 간단한 기준을 충족하는 경우) 데이터 수집에 필요한 시간과 재료 비용이 최소화됩니다. 반대로, 잠재적인 응답자가 충족해야 하는 기준의 수가 증가함에 따라 재료비와 시간 비용이 모두 증가합니다.

그림에서. 그림 15.2는 특정 스포츠에 참여하는 성인 인구의 비율을 보여줍니다. 그림의 데이터는 오토바이를 타는 사람들(전체 성인 수의 3.6%)을 검사하는 것이 정기적으로 여가 산책을 하는 사람들(전체 성인 수의 27.4%)을 검사하는 것보다 훨씬 더 어렵고 비용이 많이 든다는 것을 나타냅니다. 가장 중요한 것은 연구자가 연구 대상 모집단에 어떤 요소를 포함해야 하고 어떤 요소를 제외해야 하는지를 정확하게 결정하는 것입니다. 연구 목표에 대한 명확한 설명은 이 문제의 해결을 크게 촉진합니다. 샘플 선택 프로세스의 두 번째 단계는 이미 알고 있듯이 샘플을 추출할 요소 목록인 샘플 프레임을 결정하는 것입니다. 연구의 대상 인구는 달라스 지역에 거주하는 모든 가족이라고 가정합니다. 언뜻 보기에 좋고 쉽게 접근할 수 있는 샘플링 프레임은 달라스 전화번호부일 것입니다. 그러나 자세히 살펴보면, 목록에 포함된 가족 목록이 일부 가족의 수가 생략되어 있기 때문에(물론 전화가 없는 가족은 포함되지 않음) 완전히 정확하지 않다는 것이 분명해집니다. 일부 가족은 전화번호가 여러 개 있습니다. 최근 거주지를 변경한 사람과 그에 따른 전화번호도 디렉토리에 포함되지 않습니다.

숙련된 연구자들은 샘플링 프레임과 관심 대상 모집단이 정확히 일치하는 경우가 거의 없다는 사실을 발견했습니다. 표본 디자인의 가장 창의적인 단계 중 하나는 모집단 항목을 나열하기 어려울 때 적절한 표본 추출 프레임을 결정하는 것입니다. 예를 들어 전화번호부의 단점으로 인해 무작위 다이얼링이 사용되는 경우 작업 블록 및 접두사에서 샘플링이 필요할 수 있습니다. 그러나 지난 10년 동안 작업 단위가 크게 증가하면서 이 작업이 더욱 어려워졌습니다. 예를 들어 대상 인구가 개인이지만 정확한 현재 목록이 없는 경우 후속 하위 표본을 채취하여 영토 또는 조직을 선택적으로 관찰하는 동안 유사한 상황이 발생할 수 있습니다.

출처: SSI에 포함된 데이터 기준 라이트 TM: 엘아야 발생률 티목표로 삼은 에스증폭"(Fairfield, Conn.: Survey Sampling, Inc., 1994).

샘플링 절차의 세 번째 단계는 샘플링 프레임 결정과 밀접한 관련이 있습니다. 샘플링 방법이나 절차의 선택은 연구자가 채택한 샘플링 프레임에 따라 크게 달라집니다. 다양한 유형의 샘플에는 다양한 유형의 샘플링 프레임이 필요합니다. 이 장과 다음 장에서는 마케팅 조사에 사용되는 주요 샘플 유형에 대한 개요를 제공합니다. 이를 설명할 때 샘플링 프레임과 그 형성 방법 사이의 연관성이 분명해져야 합니다.

표본 추출 절차의 네 번째 단계는 표본 크기를 결정하는 것입니다. 이 문제는 챕터에서 논의됩니다. 17. 다섯 번째 단계에서는 연구자가 실제로 조사할 요소를 선택해야 한다. 이 목적에 사용되는 방법은 선택한 샘플 유형에 따라 결정됩니다. 샘플링 방법을 논의할 때 요소 선택에 대해서도 이야기하겠습니다. 마지막으로, 연구자는 선정된 응답자들을 대상으로 실제로 설문조사를 해야 합니다. 이 단계에서는 많은 실수를 저지를 확률이 높습니다.
이러한 문제와 이를 해결하기 위한 몇 가지 방법은 이 장에서 논의됩니다. 18.

샘플링(샘플링) 계획의 유형

모든 샘플링 제어 방법은 확률 샘플 관찰과 결정적 샘플 관찰이라는 두 가지 범주로 나눌 수 있습니다. 모집단의 각 구성원은 0이 아닌 특정 확률로 확률 표본에 포함될 수 있습니다. 표본에 모집단의 특정 구성원이 포함될 확률은 다양할 수 있지만 각 요소가 표본에 포함될 확률은 알려져 있습니다. 이 확률은 샘플 요소를 선택하는 데 사용되는 특정 기계적 절차에 의해 결정됩니다.

결정론적 표본의 경우 표본에 요소가 포함될 확률을 평가하는 것이 불가능합니다. 그러한 표본의 대표성은 보장할 수 없습니다. 예를 들어, 올스테이트 코퍼레이션 1,400만 가구(고객)의 보험 청구 데이터를 처리하는 시스템을 개발했습니다. 회사는 이 데이터를 사용하여 서비스에 대한 수요 패턴을 결정할 계획입니다. 예를 들어 Mercedes Benz를 소유한 가구가 별장도 소유할 가능성(보험이 필요함)이 있습니다. 데이터베이스는 매우 방대하지만 회사는 특정 고객이 청구할 가능성을 평가할 수 있는 수단이 없습니다. 따라서 회사는 청구를 하는 고객에 대한 데이터가 회사의 모든 고객을 대표하는지 확신할 수 없습니다. 잠재 고객과 관련하여 훨씬 적습니다.

모든 결정론적 샘플은 샘플 요소를 선택하는 기계적 절차보다는 연구자의 개별 입장, 판단 또는 선호도를 기반으로 합니다. 이러한 선호도는 때때로 모집단 특성에 대한 좋은 추정치를 제공할 수 있지만 표본이 현재 작업에 적합한지 여부를 객관적으로 결정할 수 있는 방법은 없습니다. 샘플링 결과의 정확성에 대한 평가는 특정 요소를 선택할 확률이 알려진 경우에만 이루어질 수 있습니다. 이러한 이유로 확률 샘플링은 일반적으로 샘플링 오류의 크기를 추정하는 우수한 방법으로 간주됩니다. 샘플은 고정 크기 샘플과 순차 샘플로 나눌 수도 있습니다. 고정된 크기의 표본을 사용하는 경우에는 조사가 시작되기 전에 표본 크기가 결정되며, 결과 분석에 앞서 필요한 모든 데이터가 수집됩니다. 우리는 고정된 크기의 표본에 주로 관심을 가질 것입니다. 이는 일반적으로 마케팅 조사에 사용되는 유형이기 때문입니다.

확률 샘플링
모집단의 각 요소가 0이 아닌 알려진 확률로 포함될 수 있는 표본입니다.
결정적 샘플링
특정 요소의 선택을 결정하는 특정 개인적 선호 또는 판단을 기반으로 한 샘플링 이 경우 표본에 임의의 모집단 요소가 포함될 확률을 평가하는 것이 불가능해집니다.

그러나 아래에 설명된 기본 샘플링 설계 각각과 함께 사용할 수 있는 순차적 샘플도 있다는 점을 잊어서는 안 됩니다.

순차 샘플링에서는 선택된 요소의 개수를 미리 알 수 없으며 일련의 순차 결정을 통해 결정됩니다. 소규모 표본을 대상으로 한 조사로 신뢰성 있는 결과를 얻을 수 없는 경우에는 조사 대상 요소의 범위를 확대합니다. 결과가 여전히 결론에 이르지 못하면 표본 크기가 다시 늘어납니다. 각 단계에서는 얻은 결과가 충분히 설득력이 있다고 간주되는지 또는 데이터 수집을 계속할지 여부에 대한 결정이 내려집니다. 순차적 샘플을 사용하면 수집된 데이터의 추세를 평가할 수 있으므로 타당성이 전혀 없는 경우 추가 관찰과 관련된 비용을 줄일 수 있습니다.

확률론적 및 결정론적 샘플링 설계 모두 다양한 유형으로 제공됩니다. 예를 들어, 결정론적 샘플은 비대표적(편리함), 의도적 또는 할당량일 수 있으며, 확률 샘플은 단순 무작위, 계층화 또는 그룹(클러스터)으로 나누어지고 하위 유형으로 나눌 수 있습니다. 그림에서. 그림 15.3은 이 장과 다음 장에서 논의될 샘플 유형을 보여줍니다.

고정량 샘플링(고정 샘플링)
크기가 선험적으로 결정된 샘플입니다. 필요한 정보는 선택한 요소에서 결정됩니다.
순차적 샘플링
일련의 순차적 결정을 기반으로 형성된 샘플입니다. 작은 표본을 고려한 후 결과가 결정적이지 않은 것으로 나타나면 더 큰 표본이 고려됩니다. 이 단계에서 결과가 나오지 않으면 표본 크기가 다시 증가합니다. 따라서 각 단계에서 얻은 결과가 충분히 설득력 있는 것으로 간주될 수 있는지 여부에 대한 결정이 내려집니다.

기본 샘플링 유형을 결합하여 보다 복잡한 샘플링 계획을 만들 수 있다는 점을 기억해야 합니다. 기본 초기 유형을 이해하면 더 복잡한 조합을 이해하는 것이 더 쉬울 것입니다.

결정적 샘플

이미 언급했듯이 결정론적 표본의 요소를 선택할 때 개인 평가 또는 결정이 결정적인 역할을 합니다. 때로는 이러한 추정치가 연구자로부터 나오지만 다른 경우에는 모집단 요소 선택이 현장 작업자에게 맡겨집니다. 요소가 기계적으로 선택되지 않기 때문에 샘플에 임의의 요소가 포함될 확률을 결정하고 이에 따라 샘플링 오류가 불가능해집니다. 선택한 샘플링 절차로 인한 오류를 무시하면 연구자가 추정치의 정확성을 평가할 수 없습니다.

비대표성(편의) 샘플

비대표성(편의) 샘플표본 요소의 선택이 "무작위" 방식으로 수행되기 때문에 때때로 무작위라고 불립니다. 즉, 표본 추출 기간 동안 가장 많이 사용 가능하거나 그렇게 보이는 요소가 선택됩니다.

우리의 일상생활은 그러한 선택의 예들로 가득 차 있습니다. 우리는 친구들과 이야기를 나누고 그들의 반응과 입장을 바탕으로 사회에 만연한 정치적 편견에 관해 결론을 내립니다. 지역 라디오 방송국은 사람들에게 논쟁의 여지가 있는 문제에 대한 자신의 견해를 표현하도록 요청하며, 그들이 표현한 견해는 널리 알려진 것으로 해석됩니다. 우리는 자원봉사자들이 우리를 돕기 위해 자원하는 사람들과 협력하고 함께 일할 것을 권장합니다. 편의 표본의 문제는 명백합니다. 이러한 종류의 표본이 실제로 대상 모집단을 대표하는지 확신할 수 없습니다. 우리는 친구들의 의견이 사회에 널리 퍼져 있는 정치적 견해를 정확하게 반영하는지 여전히 의심할 수 있지만, 동일한 방식으로 선택된 더 큰 표본이 대표적이라고 믿고 싶어하는 경우가 많습니다. 예를 들어 그러한 가정의 오류를 보여드리겠습니다.
몇 년 전, 이 책의 저자가 살고 있는 도시의 한 지역 텔레비전 방송국에서는 지역 사회의 관심 주제에 대해 매일 여론 조사를 실시했습니다. 'Pulse of Madison'이라 불리는 여론조사는 다음과 같이 진행되었습니다. 매일 저녁 6시 뉴스가 진행되는 동안 방송국은 시청자들에게 특정 논란의 여지가 있는 문제에 대해 질문을 하고 이에 대해 긍정적이거나 부정적인 답변을 해야 했습니다.

긍정적인 대답이면 다른 전화번호로 전화해야 하고, 부정적인 대답이면 다른 전화번호로 전화해야 했습니다. '찬성'과 '반대' 투표 수가 자동으로 계산되었습니다. 10시 뉴스 방송에서는 전화 조사 결과를 보도했다. 매일 저녁 500~1000명의 사람들이 스튜디오에 전화를 걸어 이런저런 문제에 대한 자신의 입장을 표현하고 싶어했습니다. 텔레비전 해설자는 여론 조사 결과를 주류 여론으로 해석했습니다.

비대표성(편의) 샘플
표본 요소 선택이 "무작위" 방식으로 수행되기 때문에 무작위라고도 합니다. 즉, 표본 추출 기간 동안 가장 가용성이 높거나 그렇게 보이는 요소가 선택됩니다.

6시간짜리 에피소드 중 하나에서 시청자들은 “매디슨의 음주 연령을 18세로 낮추어야 한다고 생각하시나요?”라는 질문을 받았습니다. 기존 법적 연령은 21세였습니다. 청중은 이 질문에 특별한 활동으로 응답했습니다. 그날 저녁 거의 4,000명이 스튜디오에 전화를 걸었고 그 중 78%가 연령 제한을 낮추는 데 찬성했습니다. 4,000명의 표본이 180,000명의 커뮤니티를 "대표해야" 한다는 것은 분명한 것 같습니다. 이미 짐작하셨겠지만, 인구의 특정 연령 그룹은 다른 연령 그룹보다 알려진 투표 결과에 훨씬 더 관심이 있었습니다. 따라서 몇 주 후 이 문제를 논의할 때 설문 조사에 할당된 시간 동안 학생들이 함께 행동한 것으로 밝혀진 것은 놀라운 일이 아닙니다. 그들은 차례로 여러 번 텔레비전에 전화를 걸었습니다. 따라서 표본 크기나 법 자유화 지지자의 비율은 전혀 놀라운 것이 아닙니다. 표본이 대표적이지 않았습니다.

단순히 표본 크기를 늘리는 것만으로는 대표성을 확보할 수 없습니다. 샘플의 대표성은 크기가 아니라 요소 선택을 위한 적절한 절차를 통해 보장됩니다. 설문조사 참여자가 자발적으로 식별되거나 가용성에 따라 표본 요소가 선택되는 경우 표본 추출 계획이 표본의 대표성을 보장하지 않습니다. 경험적 증거에 따르면 편의상의 이유로 선택된 표본은 (표본 크기에 관계없이) 대표성을 나타내는 경우가 거의 없습니다. 800-900표를 조사하는 전화 여론조사는 규모는 크지만 대표성이 없는 표본의 가장 일반적인 형태입니다.

목적이 있는 샘플링
결정적(의도적) 샘플링, 요소가 수동으로 선택됨 연구자의 의견으로는 설문조사의 목적을 충족하는 요소가 정확하게 선택됩니다.
원하는 특성을 가진 초기 응답자 세트를 식별하는 연구자의 능력에 따른 목적 있는 샘플링. 이 응답자들은 개인의 추가 선택을 결정하기 위한 정보 제공자로 사용됩니다.

불행하게도 많은 사람들은 그러한 설문조사 결과를 확신을 가지고 받아들입니다. 국제 마케팅 연구에서 비대표 표본을 사용하는 가장 일반적인 예 중 하나는 조사를 시작한 국가의 영토에 현재 거주하는 외국인으로 구성된 표본을 기반으로 특정 국가에 대한 조사입니다(예: 미국). 그러한 표본이 문제의 인구의 특정 측면을 밝힐 수는 있지만, 이러한 개인은 일반적으로 자국과의 연결이 다소 조건적일 수 있는 "미국화된" 엘리트를 대표한다는 점을 기억해야 합니다. 설명적 또는 인과적 조사를 수행할 때 대표성이 없는 표본을 사용하는 것은 권장되지 않습니다. 이는 특정 아이디어나 개념을 발전시키기 위한 탐색적 연구에서만 허용되지만, 이 경우에도 의도적인 표본을 사용하는 것이 바람직하다.

목적이 있는 샘플링

목적 있는 샘플링이라고도 합니다. 초점이 맞지 않은; 연구자가 연구 목적에 부합한다고 생각하는 요소는 수동으로 선택됩니다. 프록터 앤 갬블신시내티 본사 근처에 거주하는 13~17세 청소년에게 광고를 표시할 때 이 방법을 사용했습니다. 회사의 식품 및 음료 부문에서는 이 십대 그룹을 고용하여 일종의 소비자 표본 역할을 했습니다. 그들은 1,000달러를 받고 일주일에 10시간 일하고 콘서트에 가서 텔레비전 광고를 보고, 회사 관리자와 함께 슈퍼마켓을 방문하여 제품 진열을 보고, 신제품을 테스트하고, 구매 행동에 대해 논의했습니다. 무작위가 아닌 "채용" 프로세스를 통해 표본 대표자를 선택함으로써 회사는 자신의 견해가 해당 연령대를 대표하지 못할 위험을 무릅쓰고 자신을 명확하게 표현하는 10대의 능력과 같이 유용하다고 간주되는 특성에 집중할 수 있었습니다.

이미 언급한 바와 같이, 의도적인 샘플링의 특징은 해당 요소를 목적에 맞게 선택하는 것입니다. 어떤 경우에는 표본 요소가 대표성 때문이 아니라 연구자에게 관심 있는 정보를 제공할 수 있기 때문에 선택됩니다. 법원이 전문가 증언에 의존하는 것은 어떤 의미에서는 의도적인 표본 추출을 사용하는 것과 같습니다. 연구 프로젝트를 개발할 때도 비슷한 입장이 우세할 수 있습니다. 문제에 대한 초기 연구 동안 연구자는 주로 표본 요소의 선택을 결정하는 연구의 전망을 결정하는 데 관심이 있습니다.

눈덩이 샘플링특별한 유형의 모집단을 대상으로 작업할 때 사용되는 목적 샘플링 유형입니다. 이 표본은 원하는 특성을 가진 초기 응답자 세트를 식별하는 연구자의 능력에 따라 달라집니다. 이 응답자들은 개인의 추가 선택을 결정하기 위한 정보 제공자로 사용됩니다.

예를 들어, 한 회사가 청각 장애인이 전화로 의사소통할 수 있게 해주는 특정 제품의 필요성을 평가하려고 한다고 상상해 보십시오. 연구자들은 청각 장애인 커뮤니티의 주요 인물을 식별함으로써 이 문제를 개발하기 시작할 수 있습니다. 후자는 설문 조사에 참여하기로 동의할 이 그룹의 다른 구성원을 지명할 수 있습니다. 이러한 전술을 사용하면 샘플이 눈덩이처럼 커집니다.

연구자가 문제를 탐색하고 계획된 조사의 전망과 가능한 한계를 결정하는 초기 단계에 있는 동안 목적 샘플링을 사용하는 것은 매우 효과적일 수 있습니다. 그러나 어떠한 경우에도 이러한 유형의 표본의 약점을 잊어서는 안 됩니다. 왜냐하면 연구원이 설명적 또는 인과적 연구에서 표본을 사용할 수도 있으며 이는 결과의 품질에 즉시 영향을 미치기 때문입니다. 그러한 망각의 전형적인 예는 소비자 물가 지수(“CPI”)입니다. Südman이 지적했듯이( 수드만): “CPI는 56개 도시 및 광역권에 대해서만 결정되며, 그 선택도 정치적 요인의 영향을 받습니다. 실제로 이러한 도시는 도시 자체만을 나타낼 수 있으며 지수는 다음과 같습니다. 시급을 받는 도시민의 소비자물가지수*, 그리고 직원그리고 대부분의 사람들에게 미국 어느 지역의 물가 수준을 반영하는 지수로 나타납니다. 소매점 선택 자체도 무작위가 아닌 방식으로 이루어지며, 그 결과 가능한 샘플링 오류를 추정하는 것이 불가능해집니다."(강조 추가) 2.

* 즉, 노동자입니다. - 메모. 레인

할당량 샘플

세 번째 유형의 결정론적 샘플링은 다음과 같습니다. 할당량 샘플; 알려진 대표성은 연구 중인 모집단과 동일한 특성을 가진 요소를 동일한 비율로 포함함으로써 달성됩니다(“연구 창 15.1” 참조). 예를 들어 캠퍼스에 거주하는 학생들의 대표 표본을 만드는 것을 고려해 볼 수 있습니다. 500명으로 구성된 특정 표본에 고학년 학생이 단 한 명도 없다면, 우리는 표본의 대표성과 이 표본에서 얻은 결과를 조사 대상 인구에 적용하는 적법성을 의심할 권리가 있습니다. 비례 표본을 사용하여 작업할 때 연구원은 표본의 상급생 비율이 전체 학생 수에서의 비율과 일치하는지 확인할 수 있습니다.

연구자가 대학생을 대상으로 표본 연구를 수행하고 있으며 표본이 성별뿐만 아니라 과정 전반에 걸친 분포도 반영하는지 확인하는 데 관심이 있다고 가정해 보겠습니다. 총 학생 수를 10,000명으로 가정합니다. 1학년 3200명, 2학년 2600명, 3학년 2200명, 4학년 2000명입니다. 그 중 남자아이는 7,000명, 여자아이는 3,000명이었습니다. 표본 크기가 1,000인 경우 비례 표본 추출 계획에는 신입생 320명, 2학년 260명, 3학년 220명, 졸업생 200명, 남학생 700명, 여학생 300명이 필요합니다. 연구자는 각 면접관에게 연락해야 할 학생을 결정하는 특정 할당량을 할당하여 이 계획을 실행할 수 있습니다.

할당량 샘플링특정 특성을 갖는 표본의 요소 비율이 연구 대상 모집단의 동일한 요소의 비율과 대략 일치하도록 선택된 결정론적 표본입니다. 각 현장 작업자에게는 접촉해야 하는 인구의 특성을 정의하는 할당량이 제공됩니다.

20번의 인터뷰를 진행하는 면접관은 다음과 같은 질문을 하도록 지시받을 수 있습니다.

신입생 6명 – 남학생 5명, 여학생 1명;
6명의 2학년 학생 - 4명의 남자아이와 2명의 여자아이;
3학년 학생 4명 – 남학생 3명, 여학생 1명;
4학년 학생 4명 – 남학생 2명, 여학생 2명.

특정 표본 요소의 선택은 연구 계획에 의해 결정되는 것이 아니라 면접관의 선택에 따라 결정되며 할당량에 의해 설정된 조건(신입생 5명, 신입생 1명 등)만 준수하도록 설계되었습니다.

또한 이 할당량은 학생 인구의 성별 분포를 정확하게 반영하지만 과정 전체에 걸쳐 학생 분포를 다소 왜곡합니다. 인터뷰의 70%(20명 중 14명)가 남학생을 대상으로 진행되지만 신입생은 30%(20명 중 6명)만이 참여하며 전체 학생 수의 32%를 차지합니다. 각 개별 면접관에게 할당된 할당량은 모집단의 통제 특성 분포를 반영하지 않을 수도 있고 일반적으로 반영하지 않습니다. 결과 샘플만이 적절한 비례성을 가져야 합니다.

비례적인 표본은 표본 요소를 선택하는 객관적인 절차보다는 개인적이고 주관적인 태도나 판단에 달려 있다는 점을 기억해야 합니다. 더욱이, 의도적인 샘플링과 달리 여기서 개인적인 판단은 프로젝트 개발자가 아닌 면접관의 몫입니다. 특정 통제 특성을 가진 모집단 구성 요소의 고유 비율을 재생산하더라도 비례 표본이 대표성으로 간주될 수 있는지 여부에 대한 의문이 제기됩니다. 이와 관련하여 세 가지 언급이 필요하다.

첫째, 표본은 다른 중요한 특성에서 모집단과 크게 다를 수 있으며 이는 결과에 심각한 영향을 미칠 수 있습니다. 예를 들어, 연구가 학생들 사이에 존재하는 인종 편견 문제에 관한 것이라면, 응답자의 출신지가 도시인지 시골인지가 중요한 상황이 될 수 있습니다. '도시/농촌 배경'이라는 특성에 대한 할당량이 지정되지 않았기 때문에 이 특성을 정확하게 표현하는 것은 불가능합니다. 물론, 잠재적으로 관련된 모든 특성에 대한 할당량을 정의하는 대안도 있습니다. 그러나 제어 특성의 수가 증가하면 사양이 더욱 복잡해집니다. 결과적으로 샘플 요소를 선택하는 것이 어렵고 때로는 불가능해지며 어떤 경우에도 비용이 증가합니다. 예를 들어, 도시 또는 농촌 배경과 사회 경제적 지위도 연구와 관련이 있는 경우 면접관은 도시의 상류층 또는 중산층인 신입생을 찾아야 할 수도 있습니다. 당신은 남자 신입생을 찾는 것이 훨씬 쉽다는 데 동의합니다.

둘째, 주어진 표본이 실제로 대표성을 갖는지 확인하는 것은 매우 어렵습니다. 물론, 통제에 포함되지 않은 특성의 분포가 모집단의 분포와 일치하는지 확인하기 위해 표본을 확인하는 것도 가능합니다. 그러나 그러한 확인은 부정적인 결론으로만 이어질 수 있습니다. 확인할 수 있는 유일한 것은 분포의 차이입니다. 이러한 각 특성에 대한 표본의 분포와 모집단이 서로 반복되는 경우, 명시적으로 지정되지 않은 방식으로 표본이 모집단과 다른 방식으로 다를 가능성이 있습니다.

그리고 마지막으로 세 번째입니다. 면접관은 자신의 장치에 맡겨지면 특정 조치를 취하는 경향이 있습니다. 그들은 너무 자주 친구들과 인터뷰를 합니다. 면접관 자신과 유사한 것으로 판명되는 경우가 많기 때문에 오류가 발생할 위험이 있습니다. 영국의 증거에 따르면 할당량 표본은 다음과 같은 경향이 있습니다.

가장 접근하기 쉬운 요소의 역할 과장;
소규모 가족의 역할을 경시합니다.
자녀가 있는 가족의 역할 과장;
산업 생산에 참여하는 노동자의 역할을 경시합니다.
최고 소득과 최저 소득을 가진 사람들의 역할을 경시합니다.
교육 수준이 낮은 시민의 역할을 경시합니다.
낮은 사회적 지위를 차지하는 사람의 역할을 경시합니다.

무작위로 지나가는 사람을 막아서 할당량을 선택하는 면접관은 쇼핑 센터, 기차역 및 공항, 대형 백화점 입구 등 잠재 응답자가 많은 지역에 집중할 가능성이 높습니다. 이러한 관행은 그러한 장소를 가장 자주 방문하는 사람들 그룹의 과잉 대표로 이어집니다. 가정 방문이 필요할 때 면접관은 편의를 위해 동기를 부여받는 경우가 많습니다.
예를 들어 낮에만 설문조사를 실시해 근로자의 의견을 과소평가하는 경우도 있다. 무엇보다도 그들은 낡은 건물에 들어가지 않으며 원칙적으로 엘리베이터가 없는 건물의 위층으로 올라가지 않습니다.

연구 중인 문제의 세부 사항에 따라 이러한 추세는 다양한 종류의 오류로 이어질 수 있지만 데이터 분석 단계에서 이를 수정하는 것은 매우 어려워 보입니다. 반면, 표본 요소를 객관적으로 선택함으로써 연구자는 주어진 표본의 대표성을 평가하는 절차를 단순화할 수 있는 특정 도구를 마음대로 사용할 수 있습니다. 이러한 표본의 대표성 문제를 분석할 때 연구자는 표본의 구성보다는 해당 요소를 선택하는 절차를 고려합니다.

연구 창: 훌륭해요! 그런데 누가 이것을 읽을 것인가?

매년 광고주는 Advertising Age에서 Yankee에 이르기까지 수많은 출판물에 게재되는 광고에 수백만 달러를 지출합니다. 텍스트와 이미지에 대한 특정 평가는 출판 전에 집에서, 광고 대행사에서 수행할 수 있습니다. 진정한 검증과 평가는 독자의 관심을 끌기 위해 경쟁하는 수십 개의 동등하게 신중하게 준비된 광고에 둘러싸인 광고가 게시된 후에만 발생합니다.

회사 로퍼스타치 월드와이드소비자, 비즈니스, 무역, 전문 잡지와 신문에 게재된 광고의 가독성을 평가하는 데 종사하고 있습니다. 연구 결과는 적절한 비용을 지불하고 광고주와 대행사의 관심을 끌게 됩니다. 광고주는 소비자에게 광고를 전달하기 위해 매일 많은 노력을 기울이기 때문에 회사는 녹말구독자에게 광고 효과에 대한 시기적절하고 정확한 정보를 제공하는 샘플을 작성하기로 결정했습니다. 회사는 매년 녹말 50,000명 이상의 사람들을 대상으로 약 20,000개의 광고를 조사했습니다. 매년 약 500개의 개별 출판물이 연구되었습니다.

Starch는 최소 표본 크기가 한 성별의 독자 100명, 다른 성별의 독자 100명인 비례 샘플링을 사용했습니다. Starch는 이 표본 크기를 통해 가독성 수준의 주요 변화가 안정화되었다고 결론지었습니다. 18세 이상의 독자를 대상으로 직접 설문조사를 실시했으며, 여기에는 특정 인구 집단을 대상으로 한 출판물을 제외한 모든 출판물이 포함되었습니다(예를 들어 Seventeen 잡지의 출판물을 평가하기 위해 같은 연령의 소녀들을 대상으로 설문조사를 실시했습니다).

설문 조사를 수행할 때 특정 출판물의 배포 영역이 고려되었습니다. 로스앤젤레스 잡지의 연구에서 남부 캘리포니아에 사는 독자들을 조사했다고 가정해 보겠습니다. 시간은 전국적으로 연구되었습니다. 설문조사는 잡지의 개별 호를 대상으로 20~30개 도시에서 동시에 실시되었습니다.

각 면접관에게는 설문조사 편견을 최소화하기 위한 작은 인터뷰 할당량이 할당되었습니다. 설문지는 다양한 직업과 연령대, 다양한 소득을 가진 사람들에게 배포되었습니다. 그러한 각 연구는 상당히 광범위한 독자층에게 입장을 제시할 수 있는 기회를 제공했습니다. 다양한 전문, 비즈니스 및 산업 출판물을 고려할 때 구독 및 배포의 세부 사항도 고려되었습니다. 분포가 상당히 좁은 출판물 전용 구독 목록을 통해 수용 가능한 응답자를 선택할 수 있었습니다.

각 설문조사에서 면접관은 응답자들에게 출판물을 살펴보라고 요청하고 광고를 발견했는지 여부를 물었습니다. 대답이 긍정적인 경우 등록 기관은 광고가 인지된 정도를 평가하기 위해 일련의 질문을 했습니다.

이 평가는 세 가지로 이루어질 수 있습니다.

주의하십시오 : 그러한 발표가 나타났다는 사실에 이미 관심을 기울인 사람들.
우리는 만났습니다: 광고된 브랜드나 광고주를 다룬 광고의 일부를 기억하는 사람들.
읽다: 광고의 절반 이상을 읽은 사람.

모든 광고를 검토한 후 면접관은 성별, 연령, 직업, 결혼 여부, 국적, 소득, 가족 규모 및 구성 등 기본 분류 정보를 기록하여 독자의 관심도를 교차표로 분석할 수 있었습니다.

올바르게 사용하면 회사 데이터 녹말광고주와 대행사는 독자의 관심을 끌고 붙잡는 광고 계획의 성공하지 못한 유형과 성공적인 유형을 모두 식별할 수 있습니다. 이러한 종류의 정보는 광고 캠페인의 효과에 주로 관심이 있는 광고주에게 매우 중요합니다.

출처: Roper Starch Worldwide, Mamaronek, NY 10543.

확률 샘플

모집단의 요소 선택은 객관적인 프로세스를 기반으로 수행되고 연구원이나 현장 작업자의 변덕과 선호도에 의존하지 않기 때문에 연구자는 모집단의 모든 요소가 확률 표본에 포함될 확률을 결정할 수 있습니다. 요소 선택 절차가 객관적이기 때문에 연구자는 결정적 표본의 경우 요소 선택이 아무리 신중하더라도 불가능했던 결과의 신뢰성을 평가할 수 있습니다.

확률적 표본이 결정적 표본보다 항상 더 대표성을 갖는다고 생각해서는 안 됩니다. 실제로 결정론적 표본이 더 대표성을 가질 수 있습니다. 확률 표본의 장점은 가능한 표본 추출 오류를 추정할 수 있다는 것입니다. 연구자가 결정론적 표본을 사용하여 작업하는 경우 해당 표본이 연구 목적에 적합한지 평가할 수 있는 객관적인 방법이 없습니다.

단순 무작위 샘플링

대부분의 사람들은 대학의 통계 과정의 일부로 또는 신문이나 잡지에서 관련 연구 결과를 읽음으로써 어떤 방식으로든 단순 무작위 표본 추출을 접해 왔습니다. 단순 무작위 샘플링에서는 표본에 포함된 각 요소가 표본에 포함될 확률이 동일하게 지정되며 원래 모집단의 모든 요소 조합이 잠재적으로 표본이 될 수 있습니다. 예를 들어, 특정 대학에 등록한 모든 학생의 단순 무작위 표본을 추출하려면 모든 학생의 목록을 만들고 각 이름에 번호를 할당한 다음 컴퓨터를 사용하여 무작위로 선택하기만 하면 됩니다. 주어진 항목 수.

인구

인구
특정 지정된 조건을 만족하는 요소 집합입니다. 연구(표적) 모집단이라고도 합니다.
매개변수
일반 또는 연구 모집단의 특정 특성 또는 지표입니다.

일반 또는 연구 대상 인구선택이 이루어지는 인구입니다. 이 세트(인구)는 일반 인구의 특성인 여러 특정 매개변수로 설명할 수 있으며, 각 매개변수는 한 인구를 다른 인구와 구별하는 특정 정량적 지표를 나타냅니다.

연구 대상 인구가 신시내티의 전체 성인 인구라고 상상해보십시오. 이 인구를 설명하기 위해 평균 연령, 고등 교육을 받은 인구 비율, 소득 수준 등 다양한 매개변수를 사용할 수 있습니다. 이러한 모든 지표에는 특정한 고정 값이 있다는 점에 유의하십시오. 물론 연구 대상 인구에 대한 전체 인구 조사를 수행하여 이를 계산할 수 있습니다. 일반적으로 우리는 자격에 의존하지 않고 표본 관찰 중에 얻은 값을 선택하고 사용하여 모집단에 필요한 매개 변수를 결정합니다.

표 1에서 말한 내용을 설명해 보겠습니다. 15.1은 20명으로 구성된 가상 인구의 예입니다. 이와 같이 소규모의 가상 인구로 작업하면 여러 가지 이점이 있습니다. 첫째, 표본 크기가 작기 때문에 이를 설명하는 데 사용할 수 있는 모집단 매개변수를 쉽게 계산할 수 있습니다. 둘째, 이 범위는 특정 샘플링 계획이 채택되면 어떤 일이 발생할 수 있는지에 대한 통찰력을 제공합니다. 이러한 두 기능을 모두 사용하면 표본 결과를 "참" 및 이 경우 알려진 모집단 값과 쉽게 비교할 수 있습니다. 이는 실제 모집단 값을 알 수 없는 일반적인 상황에서는 그렇지 않습니다. 이 경우 추정치와 "참" 값을 비교하는 것이 특히 명확해집니다.

무작위로 선택한 두 요소를 기반으로 원래 모집단에 속한 개인의 평균 소득을 추정한다고 가정해 보겠습니다. 평균 소득이 그 매개 변수가 될 것입니다. μ로 표시되는 이 평균값을 추정하려면 모든 값의 합을 해당 숫자로 나누어야 합니다.

모집단 평균 μ = 모집단 요소의 합 / 요소 수.

우리의 경우 계산 결과는 다음과 같습니다.

파생 세트

파생 세트주어진 표본추출 계획(Sampling Plan)에 따라 일반 모집단에서 선택할 수 있는 모든 가능한 표본으로 구성됩니다. 통계표본의 특성 또는 지표입니다. 표본 통계의 값은 특정 모집단 매개변수를 추정하는 데 사용됩니다. 서로 다른 표본은 동일한 모집단 매개변수에 대해 서로 다른 통계 또는 추정치를 생성합니다.

파생 세트
주어진 표본 추출 계획에 따라 모집단에서 선택할 수 있는 구별 가능한 모든 표본의 총합입니다. 통계 표본의 특성 또는 지표입니다.

표본 크기를 가정하는 샘플링 계획에 따라 20명의 개인으로 구성된 가상 모집단에서 선택할 수 있는 모든 가능한 표본의 파생 모집단을 고려하십시오 n=2반복되지 않는 무작위 선택을 통해 얻을 수 있습니다.

인구의 각 단위에 대한 데이터(우리의 경우 개인의 이름과 소득)가 머그잔에 기록된 후 주전자에 떨어지고 혼합된다고 가정해 보겠습니다. 연구원은 주전자에서 원 하나를 꺼내서 정보를 기록한 후 옆에 둡니다. 그는 주전자에서 제거된 두 번째 원에 대해서도 동일한 작업을 수행합니다. 그런 다음 연구원은 두 머그를 주전자에 다시 넣고 내용물을 섞은 다음 동일한 일련의 동작을 반복합니다. 테이블에 그림 15.2는 이 절차의 가능한 결과를 보여줍니다. 20개의 원에 대해 190개의 쌍 조합이 가능합니다.

각 조합에 대해 평균 소득을 계산할 수 있습니다. 샘플로 말하자면 AB(k= 1)

케이-e 표본 평균 = 표본 요소의 합 / 표본 요소의 수 =

그림에서. 15.4는 전체 인구의 평균 소득 추정치와 표본의 각 추정치에 대한 오차의 크기를 보여줍니다. k = 25, 62,108,147그리고 189 .

표본 평균 소득(통계)과 모집단의 평균 소득(추정이 필요한 매개변수) 사이의 관계를 고려하기 전에 파생 모집단에 대해 몇 마디 말해 보겠습니다. 첫째, 실제로 우리는 이런 종류의 집합체를 구성하지 않습니다. 이렇게 하려면 너무 많은 시간과 노력이 필요합니다. 실무자는 필요한 크기의 표본을 하나만 수집하는 것으로 제한됩니다. 연구원이 사용하는 개념최종 결론을 공식화할 때 파생된 모집단 및 관련 샘플링 분포 개념.

아래에 어떻게 표시됩니다. 둘째, 파생 모집단은 주어진 표본 추출 계획에 따라 모집단에서 선택할 수 있는 모든 가능한 다양한 표본의 총합으로 정의된다는 점을 기억해야 합니다. 표본 추출 계획의 일부가 변경되면 파생 모집단도 변경됩니다. 따라서 원을 선택할 때 연구원이 두 번째 디스크를 제거하기 전에 제거된 디스크 중 첫 번째 디스크를 용기에 반환하면 파생된 세트에 포함됩니다.

샘플 AA, BB 등 비반복 샘플의 볼륨이 2가 아닌 3과 같으면 ABC 유형의 샘플이 나타나고 이전의 경우처럼 190이 아닌 1140이 됩니다. 사례. 단순 무작위 샘플링에서 표본 요소를 선택하는 다른 방법으로 변경하면 파생 모집단도 변경됩니다.

또한 일반 모집단에서 주어진 크기의 표본을 선택하는 것은 파생 모집단에서 하나의 요소(190개 중 1개)를 선택하는 것과 동일하다는 점을 기억해야 합니다. 이 사실을 통해 우리는 많은 통계적 결론을 도출할 수 있습니다.

표본 평균과 모집단 평균

표본 평균을 실제 모집단 평균과 동일시할 권리가 있습니까? 어쨌든 우리는 그것들이 서로 연결되어 있다고 가정합니다. 그러나 우리는 또한 오류가 발생할 것이라고 믿습니다. 예를 들어, 인터넷 사용자로부터 얻은 정보는 "일반" 인구에 대한 조사 결과와 크게 다를 것이라고 가정할 수 있습니다. 다른 경우에는 상당히 근접한 일치를 가정할 수 있습니다. 그렇지 않으면 샘플 값을 사용하여 일반 값을 추정할 수 없습니다. 하지만 여기서 우리는 얼마나 큰 실수를 할 수 있습니까?

표에 포함된 모든 표본 평균을 더해 보겠습니다. 15.2, 결과 양을 샘플 수로 나눕니다. 즉, 평균을 평균해 보겠습니다.
우리는 다음과 같은 결과를 얻게 될 것입니다:

인구평균과 일치합니다. 그들은 이 경우 우리가 다루고 있다고 말합니다 편견 없는 통계.

가능한 모든 표본에 대한 평균이 추정된 모집단 모수와 같을 경우 통계는 편향되지 않은 것으로 간주됩니다. 여기서는 특정한 의미에 대해 이야기하고 있는 것이 아니라는 점에 유의하시기 바랍니다.부분 추정치는 실제 값과 상당히 다를 수 있습니다. 예를 들어 AB 또는 ST 샘플을 사용합니다. 어떤 경우에는 통계가 편견이 없더라도 가능한 표본을 고려하여 실제 모집단 값을 달성하지 못할 수도 있습니다. 우리의 경우에는 그렇지 않습니다. 가능한 전체 표본 범위(예: AT)는 실제 모집단 평균과 동일한 표본 평균을 제공합니다.

이러한 표본 추정치의 분포, 특히 이러한 추정치의 분포와 인구의 소득 수준 변동 간의 관계를 고려하는 것이 합리적입니다. 모집단의 분산은 변동의 척도로 사용됩니다. 모집단의 분산을 확인하려면 평균에서 각 값의 편차를 계산하고 모든 편차의 제곱을 더한 다음 결과 합계를 항 수로 나누어야 합니다. 인구의 분산을 a^로 표시하겠습니다. 그 다음에:

모집단 분산 σ 2 = 각 요소의 차이 제곱합
인구 및 인구 평균 / 인구 요소 수 =

분산 평균값소득수준도 같은 방식으로 결정될 수 있다. 즉, 전체 평균에서 각 평균의 편차를 결정하고 편차의 제곱을 합한 다음 결과 합계를 항 수로 나누어 이를 찾을 수 있습니다.

이 두 값 사이에는 직접적인 관계가 있기 때문에 인구의 소득 수준 분산을 사용하여 다른 방법으로 평균 소득 수준의 분산을 확인할 수 있습니다. 정확하게 말하면, 표본이 모집단의 작은 부분만을 나타내는 경우 표본 평균의 분산은 모집단의 분산을 표본 크기로 나눈 값과 같습니다.

여기서 σ x 2는 소득 수준의 평균 표본값의 분산이고, σ 2는 일반 인구의 소득 수준의 분산이며, N- 표본의 크기.

이제 결과 분포를 일반 모집단의 정량적 특성 분포와 비교해 보겠습니다. 그림 15.5는 패널 A에 표시된 정량적 특성의 모집단 분포가 다중 정점(각 20개 값이 한 번만 나타남)이고 실제 모집단 평균 9400에 대해 대칭임을 보여줍니다.

샘플 배포
주어진 샘플링 계획에 따라 모집단에서 선택할 수 있는 가능한 모든 구별 가능한 샘플에 대해 계산된 지정된 통계 값의 분포입니다.

상자 B에 표시된 점수 분포는 표 1의 데이터를 기반으로 합니다. 15.3은 테이블에서 값을 할당하여 컴파일되었습니다. 15.2를 크기에 따라 하나 또는 다른 그룹에 할당한 다음 그룹의 수를 계산합니다. 필드 B는 통계 과정의 맨 처음에 고려되는 전통적인 히스토그램입니다. 샘플링 분포통계. 다음 사항에 주목하자: 표본분포의 개념은 통계학에서 가장 중요한 개념이며, 통계적 추론을 구성하는 초석이다. 연구 중인 통계의 알려진 샘플링 분포를 기반으로 모집단의 해당 매개변수에 대한 결론을 도출할 수 있습니다. 표본 추정치가 표본마다 다르다는 사실만 알고 있고 이러한 변화의 성격을 알 수 없다면 이 추정치와 관련된 표본 추출 오류를 결정하는 것이 불가능해집니다. 추정치의 샘플링 분포는 표본 간 변동을 설명하므로 표본 추정치의 타당성을 결정하기 위한 기초를 제공합니다. 이러한 이유로 확률 표본 추출 설계는 통계적 추론에 매우 중요합니다.

모집단의 각 요소가 표본에 포함될 확률을 통해 면접관은 다양한 통계의 표본 분포를 찾을 수 있습니다. 연구자들은 표본 관찰 결과를 모집단으로 확장할 때 표본 평균, 표본 비율, 표본 분산, 기타 통계 등 이러한 분포에 의존합니다. 또한 크기 2의 표본의 경우 표본 평균의 분포는 단일 정점이고 실제 평균에 대해 대칭입니다.

그래서 우리는 다음을 보여주었습니다:

가능한 모든 표본 평균의 평균은 일반 평균과 같습니다.
표본 평균의 분산은 어떤 방식으로든 일반적인 분산과 관련됩니다.
표본 평균의 분포는 단일 정점인 반면, 일반 모집단의 정량적 특성 값 분포는 다중 정점입니다.

중심 극한 정리

부피의 단순 무작위 표본에 대해 다음과 같은 정리가 있습니다. N, 일반 평균 μ 및 분산 σ 2를 갖는 일반 모집단으로부터 분리되어 있습니다. N표본 평균 x의 분포는 중심이 μ이고 분산이 σ 2 인 정규 분포에 접근합니다. 이 근사치의 정확도는 증가함에 따라 증가합니다. N.

중심 극한 정리. 추정치의 단일 피크 분포는 중심 극한 정리의 표현으로 간주될 수 있습니다. 이는 볼륨의 단순 무작위 표본에 대해 다음과 같이 명시합니다. N, 실제 평균 μ 및 분산 σ 2를 갖는 일반 모집단과 분리되어 있습니다. N표본 평균의 분포는 중심이 실제 평균과 동일하고 분산이 표본 크기에 대한 모집단 분산의 비율과 동일한 정규 분포에 접근합니다. 즉, 다음과 같습니다.

이 근사치는 성장함에 따라 점점 더 정확해집니다. N. 이것을 기억. 모집단 유형에 관계없이 표본 평균의 분포는 충분히 큰 표본 크기의 경우 정규 분포를 따릅니다. 충분히 큰 볼륨으로 무엇을 이해해야합니까? 일반 모집단의 정량적 특성 값 분포가 정상인 경우 표본 분포는 표본 크기를 의미합니다. N=1. 모집단의 변수 분포(정량적 특성)가 대칭이지만 정규 분포가 아닌 경우 매우 작은 표본은 표본 평균의 정규 분포를 생성합니다. 일반 모집단의 정량적 특성 분포가 뚜렷한 비대칭성을 갖는 경우 더 큰 표본이 필요합니다. 그러나 표본 평균의 분포는 충분한 크기의 표본을 다루는 경우에만 정규로 받아들여질 수 있습니다.

정규 곡선을 사용하여 결론을 도출하기 위해 일반 인구의 정량적 특성 값의 정규 분포 조건에서 진행할 필요는 전혀 없습니다. 오히려 우리는 중심 극한 정리에 의존하고 모집단 분포에 따라 정규 곡선을 사용할 수 있는 표본 크기를 결정합니다. 다행스럽게도 통계의 정규분포는 상대적으로 작은 표본에 의해 보장됩니다. 15.6은 이러한 상황을 명확하게 보여줍니다. 신뢰구간 추정치. 위의 내용이 일반 평균에 대한 특정 결론을 내리는 데 도움이 될 수 있습니까? 실제로 실제로는 주어진 크기의 가능한 모든 샘플이 아닌 하나만 선택하고 얻은 데이터를 기반으로 대상 그룹에 대한 특정 결론을 도출합니다.

어떻게 이런 일이 발생하나요? 알려진 바와 같이, 정규 분포를 사용하면 모든 관찰의 특정 비율이 특정 표준 편차를 갖습니다. 관측치의 95%가 평균의 ±1.96 표준편차 내에 들어맞는다고 가정해 보겠습니다. 중심 극한 정리가 적용될 수 있는 표본 평균의 정규 분포도 이러한 의미에서 예외는 아닙니다. 이러한 표본 분포의 평균은 일반 평균 μ와 동일하며 표준 편차를 평균의 표준 오차라고 합니다.

다음과 같이 밝혀졌습니다.

표본 평균의 68.26%가 일반 평균에서 ± σ x 이하로 벗어납니다.
표본 평균의 95.45%가 일반 평균에서 ±σ x 이하로 벗어납니다.
표본 평균의 99.73%가 일반 평균에서 ± σ x 이하로 벗어납니다.

즉, 선택한 값에 따라 특정 비율의 표본이 의미됩니다. 지값에 의해 결정된 간격에 포함됩니다. 지. 이 표현식은 부등식으로 다시 작성할 수 있습니다.

일반 평균 - 지 < Среднее по выборке < Генеральное среднее + 지(평균의 제곱근 오차)

따라서 특정 확률을 갖는 표본 평균은 분포의 평균값과 특정 수의 표준 편차의 합과 차이가 경계인 구간에 있습니다. 이 불평등은 다음과 같이 변환될 수 있습니다.

샘플 평균 - 지(평균의 제곱근 오차)< Генеральное среднее < Среднее по выборке + 지(평균의 제곱근 오차)

예를 들어 비율 15.1이 관찰되는 경우 95%의 경우( 지= 1.96), 95%의 경우에서 비율 15.2가 관찰됩니다. 결론이 단일 표본 평균을 기반으로 하는 경우 식 15.2를 사용합니다.

표현식 15.2를 기억하는 것이 중요합니다. 이는 주어진 표본에 해당하는 구간에 반드시 일반 평균이 포함되어야 한다는 의미는 아닙니다. 간격은 선택 절차와 더 많은 관련이 있습니다.주어진 평균을 중심으로 구성된 구간에는 실제 모집단 평균이 포함될 수도 있고 포함되지 않을 수도 있습니다. 결론의 정확성에 대한 우리의 확신은 선택한 표본 추출 계획에 따라 구성된 모든 구간의 95%가 실제 평균을 포함한다는 사실에 기초합니다. 우리는 우리의 샘플이 이 95%에 속한다고 믿습니다.

이 중요한 점을 설명하기 위해 표본 분포가 표본 크기를 의미한다고 잠시 상상해 보겠습니다. N= 2 가상의 예에서는 정상입니다. 표 15.4는 주어진 설계 하에서 선택할 수 있는 가능한 190개의 샘플 중 처음 10개에 대한 결과를 명확하게 보여줍니다. 10개의 간격 중 7개에만 총 평균 또는 실제 평균이 포함되어 있습니다. 결론의 정확성에 대한 확신은 특정 평가에 의한 것이 아니라 정확하게 절차평가. 이 절차는 표본 평균과 신뢰 구간이 계산되는 100개의 표본에 대해 95개의 경우에 이 간격에 실제 일반 값이 포함됩니다. 특정 샘플의 정확도는 샘플을 선택한 절차에 따라 결정됩니다. 대표 표본 추출 설계는 모든 표본이 대표성을 보장하지 않습니다. 통계적 추론 절차는 표본 추출 계획의 대표성을 기반으로 하며, 이것이 바로 이 절차가 확률 표본에 매우 중요한 이유입니다.

확률 표본을 사용하면 추정치가 실제 값에 얼마나 근접하는지에 따라 결과의 정확성을 평가할 수 있습니다. 통계의 평균 제곱 오차가 클수록 추정치의 분산 정도가 높아지고 절차의 정확도가 낮아집니다.

일부 사람들은 신뢰 수준이 특정 표본 값이 아니라 절차와 관련이 있다는 사실로 인해 혼란을 겪을 수 있지만, 일반적인 값을 추정하기 위한 신뢰 수준의 크기는 연구자에 의해 조정될 수 있다는 점을 기억해야 합니다. 위험을 무릅쓰고 싶지 않고 선택한 5개의 표본 구간 중 모집단 평균이 포함되지 않은 표본 구간 중 하나가 발생할 수 있다는 우려가 있는 경우 100개의 표본 구간 중 하나만 포함하는 99% 신뢰 구간을 선택할 수 있습니다. 모집단 평균은 포함하지 않습니다. 또한 표본 크기를 늘릴 수 있으면 결과의 신뢰 수준이 높아져 모집단 값을 추정할 때 원하는 정확도를 제공할 수 있습니다. 이에 대해서는 챕터에서 더 자세히 이야기하겠습니다. 17.

우리가 설명하는 절차에는 혼란을 야기할 수 있는 구성 요소가 하나 더 있습니다. 신뢰 구간을 추정할 때 x, 지그리고 σx. 표본 평균 x는 표본 데이터로부터 계산됩니다. 지원하는 신뢰 수준에 따라 선택됩니다. 하지만 평균 σ x의 평균 제곱근 오차는 어떻습니까? 이는 다음과 같습니다:

따라서 이를 결정하려면 일반 인구의 양적 특성의 표준 편차를 설정해야 합니다. 5. 표준 편차가 다음과 같은 경우 수행할 작업 에스알려지지 않은? 이 문제는 두 가지 이유로 발생하지 않습니다. 첫째, 일반적으로 마케팅 조사에 사용되는 대부분의 정량적 속성의 경우 변동은 마케팅 담당자가 관심을 갖는 대부분의 변수 수준보다 훨씬 느리게 변화합니다. 따라서 연구가 반복되면 이전에 얻은 s 값을 계산에 사용할 수 있습니다. 둘째, 표본을 선택하고 데이터를 얻은 후에는 표본 분산을 결정하여 모집단 분산을 추정할 수 있습니다. 편향되지 않은 표본의 분산은 다음과 같이 정의됩니다.

표본 분산 ŝ 2 = 표본 평균과의 편차 제곱합 / (표본 요소 수 -1) 표본 분산을 결정하려면 먼저 표본 평균을 찾아야 합니다. 그런 다음 각 표본 값과 표본 평균 간의 차이를 찾습니다. 이러한 차이를 제곱하고 합산한 후 샘플 관측치 수에서 1을 뺀 숫자로 나눕니다. 표본 분산은 일반 분산의 추정치를 제공할 뿐만 아니라 평균의 제곱평균제곱근 오차를 추정하는 데에도 사용할 수 있습니다. 일반 분산 σ 2 를 알면 평균 제곱근 오차 σ x 도 알 수 있습니다. 그 이유는 다음과 같습니다.

일반 분산을 알 수 없는 경우 평균의 평균 제곱근 오차만 추정할 수 있습니다. 이 추정치는 주어진다 ŝ x는 표본의 표준편차를 표본 크기의 제곱근으로 나눈 값과 같습니다. 추정치는 참값의 추정치를 결정한 것과 동일한 방법으로 결정되지만, 계산식에는 일반 표준편차 대신 표본 표준편차를 대입합니다. 예를 들어, 표본 평균이 5800인 표본 AB의 경우:

따라서 ŝ = 283이고,

이제 95% 간격은

이는 이전 값보다 작습니다.

테이블에 15.5에는 이 장에서 논의된 다양한 평균과 분산에 대한 계산 공식이 요약되어 있습니다. 단순 무작위 표본의 형성. 이 예에서는 원래 모집단의 모든 요소가 포함된 주전자를 사용하여 샘플 요소를 선택했습니다. 이를 통해 파생된 모집단과 샘플링 분포의 개념을 시각화할 수 있었습니다. 실제로 이러한 방법을 사용하면 오류 가능성이 높아지므로 권장하지 않습니다. 머그는 크기와 질감이 모두 다를 수 있으며, 어떤 경우에는 어느 쪽이 더 선호될 수 있습니다. 추첨을 통해 진행된 베트남 캠페인 참가자 선정은 이러한 유형의 오류의 예가 될 수 있습니다.

선택은 큰 드럼에서 생년월일이 적힌 디스크를 당겨서 수행되었습니다. 텔레비전은 이 절차를 전국에 방송했습니다. 불행히도 디스크는 체계적인 방식으로 드럼에 로드되었습니다. 1월 날짜가 먼저 왔고 12월 날짜가 마지막이었습니다. 드럼은 집중적으로 회전되었지만 12월 날짜는 1월 날짜보다 훨씬 더 자주 떨어졌습니다. 그 후, 이 절차는 그러한 체계적 오류의 가능성이 크게 감소되는 방식으로 수정되었습니다. 단순 무작위 표본을 추출하는 데 선호되는 방법은 난수 표를 사용하는 것입니다.

이러한 테이블을 사용하려면 다음과 같은 일련의 단계가 필요합니다. 첫째, 모집단의 요소에는 1부터 1까지의 일련 번호가 할당되어야 합니다. N; 우리의 가상 전체에서 요소 ㅏ번호 1, 요소가 할당됩니다. 비- 숫자 2 등. 둘째, 난수표의 자릿수는 숫자와 동일해야 합니다. N. 을 위한 N= 20개의 두 자리 숫자가 사용됩니다. 을 위한 N 100부터 999 사이는 세 자리 숫자 등이다. 셋째, 시작 위치는 무작위로 결정되어야 한다. 해당 난수 테이블을 열고 눈을 감고 손가락으로 가리킬 수 있습니다. 난수표의 숫자는 무작위 순서이므로 시작 위치는 실제로 중요하지 않습니다.

마지막으로, 위, 아래 또는 가로질러 임의로 선택한 방향으로 이동할 수 있으며, 숫자가 테이블의 난수와 일치하는 요소를 선택할 수 있습니다. 지금까지 말한 내용을 설명하기 위해 난수에 대한 축약된 표(표 15.6)를 고려하십시오. 왜냐하면 N= 20, 두 자리 숫자로만 작업해야 합니다. 이런 의미에서 테이블. 15.6이 우리에게 딱 맞습니다. 열 아래로 이동하기로 미리 결정해 두었지만 시작 위치는 11번째 행과 4번째 열의 교차점으로 숫자 77이 위치하므로 이 숫자는 너무 커서 버려야 합니다. 다음 두 숫자도 삭제되지만 2는 요소 번호에 해당하므로 네 번째 값 02가 사용됩니다. 안에.

다음 5개 숫자도 너무 커서 폐기되고 숫자 05는 요소를 나타냅니다. 이자형. 그래서 요소는 안에그리고 이자형우리는 이 인구의 소득 수준을 판단하는 2가지 요소 표본이 될 것입니다. 난수를 생성하는 컴퓨터 프로그램을 선택의 기초로 사용하는 대체 전략도 가능합니다. 최근 출판물에 따르면 이러한 프로그램에 의해 생성된 숫자는 완전히 무작위가 아니며 복잡한 수학적 모델을 구성할 때 특정 방식으로 나타날 수 있지만 대부분의 응용 마케팅 연구에 사용될 수 있습니다. 단순 무작위 표본을 위해서는 모집단 요소의 일련번호가 매겨진 목록을 편집해야 한다는 점을 다시 한 번 기억하십시오.

즉, 원래 모집단의 각 구성원을 식별해야 합니다. 예를 들어 Fortune 잡지에 그 목록이 나와 있는 500대 미국 기업을 연구할 때 일부 인구의 경우 이는 어렵지 않습니다. 이 목록은 이미 작성되어 있으므로 이 경우 간단한 무작위 표본을 만드는 것은 어렵지 않습니다. 다른 초기 모집단(예: 특정 도시에 거주하는 모든 가족)의 경우 일반 목록을 작성하는 것이 매우 어려우므로 연구자는 다른 샘플링 계획에 의존해야 합니다.

요약

학습 목표 1
인구 조사(자격)와 표본 추출의 개념을 명확하게 구분합니다.

전체 인구 조사를 인구 조사라고 합니다. 자격. 견본선택한 요소로 구성된 컬렉션입니다.

학습 목표 2
표본 모집단을 얻기 위해 연구자가 구현하는 6단계의 본질과 순서를 알아보세요.

샘플링 과정은 6단계로 나누어집니다.

인구 할당;
샘플링 프레임을 결정하는 단계;
선택 절차의 선택;
표본 크기 결정;
샘플 요소 선택;
선택한 요소를 검사합니다.

학습 목표 3
"샘플링 프레임"의 개념 정의

샘플링 프레임은 샘플을 추출할 요소의 목록입니다.

학습 목표 4
확률과 결정론적 샘플링의 차이점을 설명하세요.

확률 표본에서 모집단의 각 구성원은 특정 값에 포함될 수 있습니다. 0이 아닌 값이 주어짐개연성. 표본에 모집단의 특정 구성원이 포함될 확률은 서로 다를 수 있지만 각 요소가 표본에 포함될 확률은 알려져 있습니다. 결정론적 표본의 경우 표본에 요소가 포함될 확률을 평가하는 것이 불가능합니다. 그러한 표본의 대표성은 보장할 수 없습니다. 모든 결정론적 샘플링은 개인적인 의견, 판단 또는 선호도를 기반으로 합니다. 이러한 선호도는 때때로 모집단 특성에 대한 좋은 추정치를 제공할 수 있지만 표본이 현재 작업에 적합한지 여부를 객관적으로 결정할 수 있는 방법은 없습니다.

학습 목표 5
고정 크기 샘플링과 다단계(순차) 샘플링 구별

고정된 크기의 표본을 사용하는 경우 설문조사가 시작되기 전에 표본 크기가 결정되고 결과 분석에 앞서 필요한 모든 데이터가 수집됩니다. 순차 샘플링에서는 선택된 요소의 개수를 미리 알 수 없으며 일련의 순차 결정을 통해 결정됩니다.

학습 목표 6
목적적 샘플링이 무엇인지 설명하고 장점과 단점을 모두 설명하세요.

목적이 있는 표본의 항목은 직접 선택되어 설문조사 목표를 충족하는 것으로 연구원에게 제시됩니다. 선택된 요소는 연구 대상 인구의 완전한 그림을 제공할 수 있다고 가정합니다. 연구자가 문제를 탐색하고 계획된 조사의 전망과 가능한 한계를 결정하는 초기 단계에 있는 동안 목적 샘플링을 사용하는 것은 매우 효과적일 수 있습니다. 그러나 어떠한 경우에도 이러한 유형의 표본의 약점을 잊어서는 안 됩니다. 왜냐하면 연구원이 설명적 또는 인과적 연구에서 표본을 사용할 수도 있으며 이는 결과의 품질에 즉시 영향을 미치기 때문입니다.

학습 목표 7
할당량 샘플링의 개념 정의

특정 특성을 갖는 표본의 요소 비율이 연구 대상 모집단의 동일한 요소의 비율과 대략 일치하도록 비례 표본이 선택됩니다. 이를 위해 각 열거자에게는 접촉해야 하는 인구의 특성을 정의하는 할당량이 제공됩니다.

학습 목표 8
샘플링 절차에서 매개변수가 무엇인지 설명하세요.

매개변수 - 일반 또는 연구 대상 인구의 특정 특성 또는 지표입니다. 한 모집단을 다른 모집단과 구별하는 특정 정량적 지표입니다.

학습 목표 9
파생 집합이 무엇인지 설명하세요.

파생 모집단은 주어진 표본 추출 계획에 따라 모집단에서 선택할 수 있는 모든 가능한 표본으로 구성됩니다.

학습 목표 10
표본분포의 개념이 통계학에서 왜 필수적인 개념인지 설명하시오.

표본분포의 개념은 통계적 추론의 초석이다. 연구 중인 통계의 알려진 샘플링 분포를 기반으로 모집단의 해당 매개변수에 대한 결론을 도출할 수 있습니다. 표본 추정치가 표본마다 다르다는 사실만 알고 있고 이러한 변화의 성격을 알 수 없다면 이 추정치와 관련된 표본 추출 오류를 결정하는 것이 불가능해집니다. 추정치의 샘플링 분포는 표본 간 변동을 설명하므로 표본 추정치의 타당성을 결정하기 위한 기초를 제공합니다.

표본은 통계 집단이다.

더 큰 그룹에서 선택된 단위, 일반

전체. 공부하는

표본을 통해 모집단에 대해 합리적인 결론을 도출할 수 있기를 바랍니다.

뛰어난 정의

불완전한 정의 ↓

견본

표본 모집단을 형성하는 과정. 단일 단계 또는 다단계 선택 방식이 사용되는지 여부에 관계없이(단일 단계 샘플링 및 다단계 샘플링 참조) 이 프로세스는 다음과 같은 특징이 있습니다. 1) 선택 단계의 수; 2) 선택의 중간 단계에서 선택된 표현 대상의 유형; 3) 선택의 중간 단계에서 식별된 표현 대상을 구역화하는 방법; 4) 각 단계에서 표현 대상과 관찰 단위를 선택하는 방법; 5) 표본 모집단의 양(관찰 단위 수). 처음 네 가지 특성은 표본의 유형, 즉 관찰 단위를 선택하는 과정의 특징을 설명하고, 다섯 번째(표본 모집단의 양)는 관찰 단위의 수로 유형 자체 내에서 표본을 구별할 수 있게 해줍니다. 표본 모집단을 형성하는 과정의 구조를 설명하는 모든 특성과 표현 대상이 선택의 중간 단계에서 영역으로 나뉘는 특성 세트가 다음과 같은 경우에만 두 표본이 유사한 것으로 간주됩니다. 동일한. 표본 모집단은 일반 모집단의 일부이며, 그 개체는 관찰의 주요 개체로 작용합니다. 일반 인구의 이 부분은 그 특성이 일반 인구의 특성을 반영하도록 특별한 규칙에 따라 선택됩니다. 따라서 일반 인구의 일부를 연구하면 전체 인구에 대한 가장 완전한 그림을 얻을 수 있으며 결과적으로 시간, 인적 자원 및 재료 비용이 절약됩니다. V.s. (연구 목적의 관점에서) 일반 인구의 주요 속성(특징)을 반영해야 합니다. 이러한 특성의 분포를 고려하여 샘플을 설계하고 품질을 평가합니다. 이는 연구자의 주요 관심 특성과 함께 결과를 분석할 때 분할표에 사용됩니다. 샘플에서 통제된 특성의 일반적인 분포를 재현하면 계산에 사용되지 않은 특성에 대한 대표성이 보장되는 것으로 이해됩니다. 이 가정이 현실과 일치하는 정도는 주로 연구 주제의 세부 사항, 연구 대상 설명의 특성과 설문 조사의 경험적 대상 간의 관계 문제에 대한 올바른 해결책에 따라 달라집니다.

뛰어난 정의

불완전한 정의 ↓

샘플이 있을 수 있습니다. 인구 및 표본. 샘플 유형. 표본 및 모집단

표본의 크기

종속 및 독립 표본

대표성

대표성이 없는 표본의 예

샘플링 유형

확률 샘플

비확률 표본

그룹 구축 전략

무작위화

쌍별 선택

계층적 선택

대략적인 모델링

노트

문학

또한보십시오

연결

다른 사전에 "선택"이 무엇인지 확인하십시오.

표본의 크기

종속 및 독립 표본

대표성

대표성이 없는 표본의 예

샘플로부터 그룹을 구성하기 위한 계획 유형

그룹 구축 전략

무작위화

쌍별 선택

샘플 설계 단계

샘플링(샘플링) 계획의 유형

결정적 샘플

비대표성(편의) 샘플

목적이 있는 샘플링

할당량 샘플

연구 창: 훌륭해요! 그런데 누가 이것을 읽을 것인가?

확률 샘플

단순 무작위 샘플링

인구

파생 세트

표본 평균과 모집단 평균

중심 극한 정리

요약

학습 목표 1 인구 조사(자격)와 표본 추출의 개념을 명확하게 구분합니다.

학습 목표 2 표본 모집단을 얻기 위해 연구자가 구현하는 6단계의 본질과 순서를 알아보세요.

학습 목표 3 "샘플링 프레임"의 개념 정의

학습 목표 4 확률과 결정론적 샘플링의 차이점을 설명하세요.

학습 목표 5 고정 크기 샘플링과 다단계(순차) 샘플링 구별

학습 목표 6 목적적 샘플링이 무엇인지 설명하고 장점과 단점을 모두 설명하세요.

학습 목표 7 할당량 샘플링의 개념 정의

학습 목표 8 샘플링 절차에서 매개변수가 무엇인지 설명하세요.

학습 목표 9 파생 집합이 무엇인지 설명하세요.

학습 목표 10 표본분포의 개념이 통계학에서 왜 필수적인 개념인지 설명하시오.

견본

학습 목표 1
인구 조사(자격)와 표본 추출의 개념을 명확하게 구분합니다.

학습 목표 2
표본 모집단을 얻기 위해 연구자가 구현하는 6단계의 본질과 순서를 알아보세요.

학습 목표 3
"샘플링 프레임"의 개념 정의

학습 목표 4
확률과 결정론적 샘플링의 차이점을 설명하세요.

학습 목표 5
고정 크기 샘플링과 다단계(순차) 샘플링 구별

학습 목표 6
목적적 샘플링이 무엇인지 설명하고 장점과 단점을 모두 설명하세요.

학습 목표 7
할당량 샘플링의 개념 정의

학습 목표 8
샘플링 절차에서 매개변수가 무엇인지 설명하세요.

학습 목표 9
파생 집합이 무엇인지 설명하세요.

학습 목표 10
표본분포의 개념이 통계학에서 왜 필수적인 개념인지 설명하시오.