통계적 혁신기술의 합의기준. 동의 기준 사용
정의 51.값이 일관성이 있는지 판단할 수 있는 기준 엑스 1 , 엑스 2 ,…, xn무작위 변수 엑스분포 함수에 관한 가설을 가지고 호출됩니다. 동의 기준.
동의 기준을 사용하는 아이디어
이 통계 자료를 바탕으로 가설을 테스트해 보겠습니다. N, SV라는 사실로 구성 엑스특정 유통법을 준수합니다. 이 법칙은 분포 함수로 지정될 수 있습니다. 에프(엑스) 또는 분포 밀도의 형태로 나타납니다. 에프(엑스) 또는 일련의 확률로 피 나는. 이 모든 것들은 분포 함수를 형성하기 때문에 에프(엑스)이 가장 일반적이고(DSV와 NSV 모두에 존재함) 다른 것을 결정하면 가설을 세울 것입니다. N, 수량이라는 사실로 구성됨 엑스분포기능을 갖고 있다 에프(엑스).
가설을 수락하거나 거부하려면 N, 수량을 고려해보세요 유, 이론적 및 통계적 분포의 발산(편차) 정도를 나타냅니다. 크기유 선택할 수 있습니다 다른 방법들 : 1) 이론적 확률의 제곱 편차의 합 피 나는해당 빈도로부터 2) 일부 계수(가중치)가 있는 동일한 제곱의 합, 3) 이론적 분포에서 통계적(경험적) 분포 함수의 최대 편차 에프(엑스).
가치를 보자 유어떤 식으로든 선택됨. 분명히 이것은 임의의 변수입니다. 분배의 법칙 유확률변수의 분포법칙에 따라 달라짐 엑스, 실험이 수행된 횟수 및 실험 횟수 N. 가설이라면 N그렇다면 수량 분포의 법칙은 다음과 같습니다. 유수량 분배의 법칙에 의해 결정됩니다. 엑스(기능 에프(엑스)) 및 숫자 N.
이 분배법칙이 알려져 있다고 가정해 보겠습니다. 이러한 일련의 실험 결과, 선택된 불일치 척도는 다음과 같은 것으로 밝혀졌습니다. 유어떤 의미를 갖게 됐어 유. 질문: 이것은 무작위적인 이유로 설명될 수 있습니까? 이 불일치도 너무 이는 크고 이론적 분포와 통계적(경험적) 분포 사이에 유의미한 차이가 존재하므로 가설이 부적합함을 나타냅니다. N? 이 질문에 답하기 위해 다음과 같은 가설을 가정합니다. N는 정확하며, 이 가정 하에서 우리는 실험 자료의 불충분한 양과 관련된 임의의 이유로 인해 불일치 측정이 발생할 확률을 계산합니다. 유실험적으로 관찰된 값보다 작지 않을 것입니다. 유즉, 사건의 확률을 계산합니다: .
이 확률이 작다면 가설은 N그럴듯하지 않아 기각되어야 하지만, 이 확률이 중요하다면 실험 데이터가 가설과 모순되지 않는다고 결론을 내립니다. N.
문제가 발생합니다. 불일치(편차) 측정을 어떻게 선택해야 합니까? 유? 그것을 선택하는 몇 가지 방법을 사용하면 수량 분포의 법칙이 밝혀졌습니다. 유매우 간단한 속성을 가지고 있으며 충분히 큰 N실질적으로 기능과 독립적 에프(엑스). 수학적 통계에서 합의 기준으로 사용되는 것은 바로 이러한 불일치 측정입니다.
정의 51/.합치 기준은 미지 분포의 가정된 법칙에 대한 가설을 검정하기 위한 기준입니다.
정규 분포에 가까운 정량적 데이터의 경우 다음을 사용합니다. 파라메트릭수학적 기대값, 표준편차 등의 지표를 기반으로 한 방법입니다. 특히, 두 표본에 대한 평균 차이의 신뢰도를 판단하기 위해 스튜던트법(기준)을 사용하고, 세 개 이상의 표본 간의 차이를 판단하기 위해 검정을 실시한다. 에프, 또는 분산 분석. 비정량적 데이터를 다루거나 표본이 너무 작아서 모집단이 정규 분포를 따른다고 확신할 수 없는 경우 다음을 사용합니다. 비모수적방법 - 기준 χ 2정성적 데이터의 경우 (카이제곱) 또는 Pearson, 순서형 데이터의 경우 부호, 순위, Mann-Whitney, Wilcoxon 등의 테스트를 사용합니다.
또한, 통계적 방법의 선택은 평균을 비교하는 표본이 일치하는지 여부에 따라 달라집니다. 독립적인(예를 들어, 두 개의 서로 다른 주제 그룹에서 가져옴) 또는 매달린(즉, 노출 전후 또는 두 가지 다른 노출 후 동일한 피험자 그룹의 결과를 반영합니다.)
pp. 1. 피어슨 테스트(- 카이제곱)
생산되게 해주세요 N무작위 변수 X가 특정 값을 취하는 각각의 독립적인 실험, 즉 무작위 변수에 대한 관찰 샘플이 제공되었습니다. 엑스(일반 인구) 볼륨 N. 이산형 분포에 대한 이론적 및 경험적 분포 함수의 근접성을 확인하는 작업, 즉 실험 데이터가 가설과 일치하는지 확인하는 작업을 고려해 보겠습니다. N 0, 랜덤 변수를 나타냅니다. 엑스유통법이 있다 에프(엑스) 유의 수준에서 α . 이 법칙을 "이론적"이라고 부르자.
가설 검정을 위한 적합도 기준을 얻을 때 측정값을 결정합니다. 디추정된(이론적) 분포 함수에서 주어진 표본의 경험적 분포 함수의 편차 에프(엑스).
가장 일반적으로 사용되는 척도는 Pearson이 도입한 척도입니다. 이 조치를 고려해 보겠습니다. 무작위 변수 값 세트를 분할해 보겠습니다. 엑스~에 아르 자형세트 - 그룹 에스 1 , 에스 2 ,…, 경, 공통점이 없습니다. 실제로 이러한 분할은 ( 아르 자형- 1) 숫자 씨 1 < 씨 2 < … < 씨알-1 . 이 경우 각 간격의 끝 부분은 해당 집합에서 제외되고 왼쪽 부분이 포함됩니다.
에스 1 에스 2 에스 3 …. 경 -1 경
씨 1 씨 2 씨 3 씨알 -1
허락하다 피 나는, , - SV가 발생할 확률 엑스세트에 속해요 나는(확실히 ). 허락하다 아니 나는, , - 세트에 속한 Observable 중 값(변형)의 개수 나는(경험적 주파수). 그러면 SV 히트의 상대 빈도는 엑스많은 나는~에 N관찰. , .
위의 분할의 경우, 피 나는증분이 있다 에프(엑스) 세트장에서 나는, 증분은 동일한 세트에 있습니다. 실험 결과를 그룹화된 통계 시리즈의 형태로 표에 요약해 보겠습니다.
그룹 경계 | 상대 빈도 |
에스 1:엑스 1 – 엑스 2 | |
에스 2: 엑스 2 – 엑스 3 | |
… | … |
경: xr – xr +1 |
이론적 분포 법칙을 알면 각 그룹에 속하는 무작위 변수의 이론적 확률을 찾을 수 있습니다. 아르 자형 1 , 아르 자형 2 , …, 홍보. 이론적 및 경험적(통계적) 분포의 일관성을 확인할 때 이론적 확률 간의 불일치부터 진행하겠습니다. 피 나는그리고 관찰된 빈도.
측정용 디이론적 분포 함수와 경험적 분포 함수의 불일치(편차)는 이론적 확률의 제곱 편차의 합을 취합니다. 피 나는특정 "가중치"를 사용하여 취한 해당 주파수에서 c 나는: .
승산 c 나는일반적으로 서로 다른 그룹에 속하는 편차는 유의성이 동일하다고 간주될 수 없기 때문에 도입됩니다. 확률 자체가 다음과 같은 경우 동일한 절대값의 편차는 거의 중요하지 않을 수 있습니다. 피 나는크고, 작으면 매우 눈에 띕니다. 그러므로 당연히 "가중치"는 c 나는확률에 반비례합니다. 이 계수를 선택하는 방법은 무엇입니까?
K. Pearson은 를 넣으면 큰 값이 나온다는 것을 보여주었습니다. N수량 분포의 법칙 유매우 간단한 특성을 가집니다. 분포 함수와 실질적으로 독립적입니다. 에프(엑스) 및 실험 횟수 N, 그러나 그룹 수에만 의존함 아르 자형즉, 이 법칙은 증가함에 따라 N소위 카이제곱 분포에 접근합니다. .
이 주제에 대한 추가 자료가 필요하거나 원하는 내용을 찾지 못한 경우 당사 저작물 데이터베이스에서 검색을 사용하는 것이 좋습니다.
받은 자료로 무엇을 할 것인가:
이 자료가 도움이 되었다면 소셜 네트워크 페이지에 저장할 수 있습니다.
이론적 및 경험적 주파수. 정규 분포 확인
변동 분포 계열을 분석할 때, 어떻게 변이 분포가 나타나는지 매우 중요합니다. 경험적 분포기호는 해당 정상. 이를 위해서는 실제 분포의 빈도를 정규 분포의 특징인 이론적인 빈도와 비교해야 합니다. 이는 실제 데이터를 기반으로 정규화된 편차의 함수인 정규 분포 곡선의 이론적 빈도를 계산해야 함을 의미합니다.
즉, 경험적 분포 곡선은 정규 분포 곡선과 정렬되어야 합니다.
규정 준수의 객관적인 특성 이론적 인그리고 경험적 주파수라는 특별한 통계 지표를 사용하여 얻을 수 있습니다. 동의 기준.
합의기준불일치 여부를 판단할 수 있는 기준이라고 합니다. 경험적그리고 이론적 인분포는 무작위이거나 유의미합니다. 즉, 관측 데이터가 제시된 통계 가설에 동의하는지 또는 동의하지 않는지 여부입니다. 제시된 가설로 인해 발생하는 인구 분포를 이론적이라고합니다.
설치가 필요합니다 표준(규칙)은 경험적 분포와 이론적 분포 사이의 불일치가 무작위인지 유의미한지 여부를 판단할 수 있게 해줍니다. 불일치가 밝혀지면 무작위의, 그러면 그들은 관찰 데이터(표본)가 일반 인구의 분포 법칙에 대해 제시된 가설과 일치한다고 믿으며 따라서 가설이 채택됩니다. 불일치가 밝혀지면 중요한이면 관측 데이터가 가설과 일치하지 않아 기각됩니다.
일반적으로 경험적 빈도와 이론적 빈도는 다음과 같은 이유로 다릅니다.
불일치는 무작위이며 제한된 수의 관찰로 인해 발생합니다.
불일치는 우연이 아니며 모집단이 정규 분포를 따른다는 통계적 가설이 잘못되었다는 사실로 설명됩니다.
따라서, 동의 기준경험적 계열의 분포 특성에 대한 계열을 정렬할 때 제시된 가설의 정확성을 거부하거나 확인할 수 있도록 합니다.
경험적 주파수관찰한 결과로 얻은 것입니다. 이론적인 주파수공식을 사용하여 계산됩니다.
을 위한 정규분포의 법칙그들은 다음과 같이 찾을 수 있습니다:
Σf i- 누적된(누적) 경험적 주파수의 합
h - 인접한 두 옵션 간의 차이
σ - 표본 표준편차
t – 정규화(표준화) 편차
Φ(t) – 정규 분포의 확률 밀도 함수(t의 해당 값에 대한 로컬 라플라스 함수 값 표에서 확인)
적합도 검정에는 여러 가지 적합도 검정이 있으며 그 중 가장 일반적인 것은 카이제곱 검정(Pearson), Kolmogorov 검정, Romanovsky 검정입니다.
Pearson χ 적합도 테스트 2 – 이론적 주파수(f T)와 경험적(f) 주파수 대 이론 주파수 간의 차이의 제곱의 비율의 합으로 표시될 수 있는 주요 주파수 중 하나:
k는 경험적 분포가 나누어지는 그룹의 수이고,
f i – i번째 그룹에서 관찰된 특성의 빈도,
f T – 이론적인 주파수.
χ 2 분포의 경우, 선택된 유의 수준 α 및 자유도 df(또는 ν)에 대한 χ 2 적합도 기준의 임계값을 나타내는 표가 작성되었습니다. 유의 수준 α는 제안된 가설을 잘못 기각할 확률입니다. 올바른 가설이 기각될 확률. R- 통계 학적으로 유의올바른 가설을 받아들인다. 통계에서는 세 가지 유의성 수준이 가장 자주 사용됩니다.
α=0.10, 이후 P=0.90(100건 중 10건)
α=0.05, 이후 P=0.95(100명 중 5명)
α=0.01이면 P=0.99(100개 중 1개) 올바른 가설을 기각할 수 있습니다.
자유도 df는 분포 계열의 그룹 수에서 연결 수를 뺀 값으로 정의됩니다. df = k –z. 연결 수는 이론적 빈도를 계산하는 데 사용되는 경험적 계열의 지표 수로 이해됩니다. 경험적 빈도와 이론적 빈도를 연결하는 지표. 예를 들어 종형 곡선에 맞춰 정렬하면 세 가지 관계가 있습니다. 따라서 다음과 같이 정렬하면 종형 곡선자유도 수는 df =k–3으로 정의됩니다. 유의성을 평가하기 위해 계산된 값을 표 χ 2 표와 비교합니다.
이론적 분포와 경험적 분포가 완전히 일치하면 χ 2 =0이고, 그렇지 않으면 χ 2 >0입니다. χ 2 계산 > χ 2 탭이면 주어진 유의성 수준과 자유도에 대해 불일치의 무의미함(무작위성)에 대한 가설을 기각합니다. χ 2를 계산하면< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняется정규 분포. Pearson의 적합도 검정은 모집단 규모가 충분히 크고(N>50) 각 그룹의 빈도가 5 이상이어야 하는 경우에 사용됩니다.
Kolmogorov 적합도 테스트축적된 경험적 빈도와 이론적 빈도 사이의 최대 불일치를 결정하는 것을 기반으로 합니다.
여기서 D와 d는 각각 경험적 분포와 이론적 분포의 누적 빈도와 누적 빈도 간의 최대 차이입니다. Kolmogorov 통계의 분포표를 사용하여 0에서 1까지 변할 수 있는 확률이 결정됩니다. P(λ) = 1이면 빈도가 완전히 일치하고 P(λ) = 0 - 완전한 불일치가 있습니다. 확률 값 P가 발견된 값 λ와 관련하여 유의미하다면 이론적 분포와 경험적 분포 간의 불일치가 중요하지 않다고, 즉 무작위라고 가정할 수 있습니다. Kolmogorov 기준을 사용하기 위한 주요 조건은 충분히 많은 수의 관측치입니다.
Kolmogorov 적합도 테스트
Kolmogorov 기준(λ)이 다음과 같은 경우에 어떻게 적용되는지 살펴보겠습니다. 정규 분포 가설 테스트일반 인구. 실제 분포를 종형 곡선과 정렬하는 작업은 여러 단계로 구성됩니다.
실제 주파수와 이론 주파수를 비교합니다.
실제 데이터를 기반으로 정규화된 편차의 함수인 정규 분포 곡선의 이론적 빈도가 결정됩니다.
그들은 특성의 분포가 어느 정도 정규에 해당하는지 확인합니다.
테이블의 IV 열의 경우:
MS Excel에서는 정규화된 편차(t)가 NORMALIZATION 함수를 사용하여 계산됩니다. 옵션(스프레드시트 행) 수만큼 사용 가능한 셀 범위를 선택해야 합니다. 선택 항목을 제거하지 않고 NORMALIZE 함수를 호출합니다. 나타나는 대화 상자에서 관찰된 값(X i), 평균(X) 및 표준 편차 Ϭ를 각각 포함하는 다음 셀을 표시합니다. 작업이 완료되어야 합니다. 동시 Ctrl+Shift+Enter를 눌러
표의 V열의 경우:
정규 분포 Φ(t)의 확률 밀도 함수는 정규화된 편차(t)의 해당 값에 대한 로컬 라플라스 함수 값 표에서 찾습니다.
표의 VI열의 경우:
콜모고로프 적합도 검정(λ)모듈을 나누어 결정 최대 차이관측치 수의 제곱근에 의한 경험적 누적 빈도와 이론적 누적 빈도 사이:
일치 기준 λ에 대한 특수 확률표를 사용하여 값 λ = 0.59가 0.88(λ)의 확률에 해당한다고 결정합니다.
경험적 및 이론적 빈도의 분포, 이론적 분포의 확률 밀도
관찰된(경험적) 분포가 이론적 분포와 일치하는지 확인하기 위해 적합도 테스트를 적용할 때 단순 가설 테스트와 복잡한 가설 테스트를 구별해야 합니다.
1-표본 Kolmogorov-Smirnov 정규성 검정은 다음을 기반으로 합니다. 최대 차이표본의 경험적 누적 분포와 추정된(이론적) 누적 분포 사이. Kolmogorov-Smirnov D 통계량이 유의하면 해당 분포가 정규 분포라는 가설은 기각되어야 합니다.
변형 표시기는 연결의 친밀도를 평가하는 데 사용됩니다.
1. 총 분산 유효 속성 - 요인의 누적 영향을 반영합니다.
2. 요인 분산 유효 특성 - 연구 중인 요인의 영향으로 인한 변화만 반영합니다. 엑스:
균등화된 값의 변동을 특성화합니다. yx전체 평균에서.
3. 잔차 분산 결과 특성의 변화를 표시합니다. ~에제외한 다른 모든 것으로부터 엑스요인:
요인과 일반 사이의 관계는 요인과 일반 사이의 연결의 친밀도를 반영합니다. 엑스그리고 유.
결정 지수 – 전체 분산에서 요인 분산의 비율. 이 표현식을 로 표현하면, 아르 자형그것은 될 것이다 상관 지수 .
분산 추가 규칙(=+)에 따라 상관 지수는 다음과 같이 나타낼 수 있습니다. 또는 상관 지수는 모든 형태의 통신에 대한 연결의 친밀도를 평가하는 데 사용됩니다.
선형 연결의 견고성을 측정하는 데 사용됩니다. 선형 상관 계수:
지표 간 관계의 근접성에 대한 질적 평가는 Chaddock 척도를 사용하여 제공됩니다.
조건부 예를 사용하여 쌍 상관 관계의 회귀 상관 분석 사용을 고려해 보겠습니다. 호텔 객실의 연간 평균 점유율과 활동 수익성이 서로 다른 8개 호텔의 작업에 대한 선택적 정보가 있습니다. 회귀 상관 분석 결과, 호텔 객실 점유율 사이에 직접적인 관계가 있는지, 그렇다면 얼마나 가까운지 확인하는 것이 매우 중요합니다.
Npp | 충전 용량(%% 단위) x | 수익성(%%) | x 2 | 2시에 | xy | 평준화된(이론적) y x |
8,2 7,0 9,3 8,1 9,5 10,5 7,5 6,3 | 67,24 49,00 86,49 65,61 90,25 110,25 56,25 39,69 | 492,0 364,0 669,6 526,5 712,5 840,0 420,0 315,0 | 7,61 6,65 9,05 8,21 9,41 10,01 7,13 6,41 | |||
66,4 | 564,78 | 4339,6 | 64,48 |
선형 쌍 회귀 방정식의 매개변수를 결정해 보겠습니다.
쌍별 회귀 방정식은 다음과 같습니다. 이 방정식에 x의 경험치를 대입하여 이론치 7.61 등을 계산해 보겠습니다.
이제 호텔 점유율과 활동 수익성 사이의 밀접한 관계를 살펴보겠습니다.
분석 결과, 호텔 이용률과 활동 수익성 사이에는 직접적이고 매우 높은 관계가 있는 것으로 나타났습니다.
실제로 경험적 빈도와 이론적인 빈도의 근접성을 평가하는 것이 종종 매우 중요합니다. 이 평가는 근접성 기준을 사용하여 이루어질 수 있습니다. 동의 기준. 이러한 목적으로 가장 자주 사용됩니다 – 피어슨 적합도 테스트 (ʼʼhiʼʼ- 제곱)은 다음 공식으로 계산됩니다.
어디 에프 -경험적 주파수,
이론적인 주파수.
경험적 빈도와 이론적 빈도의 근접성에 대한 평가는 달성 확률에 의해 결정됩니다. 주어진 값 아르 자형( ) 무작위 주파수 편차의 경우. 확률이라면 아르 자형( ) 0과 크게 다르면(0.05 이상) 이론적 빈도와 경험적 빈도의 편차는 무작위로 간주될 수 있습니다. 만약에 아르 자형( )< 0.05이면 편차는 무작위로 간주될 수 없으며 경험적 및 이론적 분포는 근본적으로 서로 다릅니다.
크기 이론적 빈도와 실제 빈도의 편차뿐만 아니라 인구가 분할되는 그룹의 수와 관련하여 임계 값 표에 따라 달라집니다. 경험적 주파수의 다양한 자유도에 대해 계산됩니다(부록). 정규 분포의 경우 자유도의 수는 다음과 같습니다. K=n-3, 어디 N– 그룹 수.P( , 0.05를 크게 초과합니다. 즉, 실제 빈도와 경험적 빈도의 편차는 무작위로 간주될 수 있으며 티켓 판매 자체의 분포는 정규 분포에 가깝습니다.
부록 1
동의 기준 - 개념 및 유형. "동의 기준" 카테고리의 분류 및 특징 2017, 2018.
특정 분포의 성격에 대한 모든 가정은 가설이고 범주형 진술이 아니기 때문에 당연히 소위 적합도 기준을 사용하여 통계 테스트를 거쳐야 합니다.
확립된 분배 법칙에 기초한 합의 기준을 사용하면 이론적 빈도와 경험적 빈도 사이의 불일치가 중요하지 않은 것으로 간주되어야 하는 경우(무작위)와 중요한 경우(비무작위)를 설정할 수 있습니다. 따라서 일치 기준을 사용하면 계열을 정렬할 때 제시된 가설의 정확성을 거부하거나 확인할 수 있습니다.
경험적 계열의 분포의 성격에 대해 질문하고 주어진 경험적 분포에 대해 일부 이론적 분포 법칙으로 표현된 모델을 수용하는 것이 가능한지 답합니다.
동의 기준에는 여러 가지가 있습니다. 가장 일반적으로 사용되는 기준은 Pearson, Romanovsky 및 Kolmogorov입니다. 그들을 살펴보자.
피어슨의 적합도 검정 %2(카이제곱)는 주요 적합도 검정 중 하나입니다. 이 기준은 경험적 분포와 이론적 분포의 빈도 사이의 불일치의 무작위성(유의성)을 평가하기 위해 영국 수학자 Karl Pearson(1857-1936)에 의해 제안되었습니다. 피어슨 기준, 여기서 k
경험적 분포가 나누어지는 그룹의 수;
그룹 I에서 관찰된 특성의 빈도; 가정된 분포로부터 계산된 이론적 빈도. 분포 y)에 대해 선택된 유의 수준 a와 주어진 자유도 V에 대한 적합도 기준 %2의 임계값을 나타내는 표가 작성되었습니다(부록 4 참조).
유의 수준 a - 제안된 가설을 잘못 기각할 확률, 즉 올바른 가설이 기각될 확률. 통계 연구에서는 해결되는 문제의 중요성과 책임에 따라 다음과 같은 세 가지 유의성 수준이 사용됩니다. 1)
a = 0.10, P = 0.90; 2)
a = 0.05, P = 0.95; 삼)
a = 0.01, P = 0.99.
예를 들어, 확률이 0.01이면 100개 중 1개의 경우에 올바른 가설이 기각될 수 있음을 의미합니다. 경제 연구에서는 0.05의 오류 확률이 실질적으로 허용 가능한 것으로 간주됩니다. 100번 중 5번은 올바른 가설이 기각될 수 있습니다.
또한 표에서 결정된 %2 기준도 자유도에 따라 달라집니다. 자유도 V는 분포 계열 k의 그룹 수에서 V와의 연결 수를 뺀 값으로 정의됩니다.
연결 수는 이론적 빈도를 계산하는 데 사용되는 경험적 계열의 지표 수로 이해됩니다. 경험적 및 이론적 연결 지표 / l
어떤 주파수
따라서 정규 분포 곡선을 따라 정렬하는 경우 세 가지 연결이 있습니다.
x ~ x" " SU = a" * x W = U
EMF 이론' EMF TeOr> ^ 1EMF ^ /theor*
따라서 정규 분포 곡선을 따라 정렬하면 자유도는 V = k - 3으로 결정됩니다. 여기서 k는 계열의 그룹 수입니다.
포아송 곡선을 따라 정렬하는 경우 V = k - 2입니다. 왜냐하면 주파수를 구성할 때 두 개의 제한 연결이 사용되기 때문입니다: x, 1tr /
유의성을 평가하기 위해 계산된 값 %2calc를 표로 작성된 값 %2tab과 비교합니다.
이론적 분포와 경험적 분포가 완전히 일치하면 %2 = 0이고, 그렇지 않으면 %2 > 0입니다.
Hrasch > Xtab' T0가 주어진 유의성 수준 a와 자유도 V와 함께라면 불일치의 무의미함(무작위성)에 대한 가설을 기각합니다.
%2acc ^ X2tabL'이면 경험적 계열이 예상 분포의 가설과 잘 일치한다고 결론을 내리고 확률(1 - a)을 사용하면 이론적 빈도와 경험적 빈도 사이의 불일치가 무작위라고 주장할 수 있습니다.
합의 기준?2을 사용하려면 다음 조건이 충족되어야 합니다. 1)
연구 중인 모집단의 규모는 충분히 커야 하며(VI> 50), 각 그룹의 빈도 또는 크기는 5 이상이어야 합니다.
이 조건을 위반하면 먼저 작은 주파수를 결합해야 합니다. 2)
경험적 분포는 무작위 샘플링의 결과로 얻은 데이터로 구성되어야 합니다. 즉, 그들은 독립적이어야 합니다.
경험적 계열의 경우 분포는 빈도 / \ t로 지정됩니다.
그런 다음 y)는 공식을 사용하여 계산되어야 합니다
Romanovsky Kr 기준은 Pearson 기준 %2의 사용을 기반으로 합니다. 이미 찾은 값 %2 및 자유도 v:
%2에 대한 테이블이 없으면 매우 편리합니다.
Kr 3이면 무작위가 아닙니다.
따라서 이론적 분포는 연구 중인 경험적 분포의 모델 역할을 할 수 없습니다.
Kolmogorov X 기준은 축적된 빈도 또는 경험적 분포와 이론적 분포의 빈도 사이의 최대 불일치를 결정하는 것을 기반으로 합니다.
X = -2= 또는 X = , iN
여기서 Dud는 각각 누적 주파수(F - F")와 누적 주파수 사이의 최대 차이입니다.
경험적 및 이론적 분포 계열의 빈도(p - p");
N은 집계된 단위 수입니다.
표 P(k)(부록 6 참조)를 사용하여 X 값을 계산한 후, 이론적 빈도와 경험적 빈도의 편차가 무작위라고 말할 수 있는 확률이 결정됩니다. 확률 P(k)는 0에서 1까지 다양합니다. P(k) = 1이면 주파수가 완전히 일치하고, P(k) = 0이면 완전한 불일치가 있습니다. A가 최대 0.3의 값을 취하면 P(k) = 1입니다.
Kolmogorov 기준을 사용하기 위한 주요 조건은 충분히 많은 수의 관측치입니다.
예. 테이블의 데이터를 사용합니다. 5.17, 정규 분포의 법칙에 따라 해당 지역의 징집병 분포에 대해 제시된 가설이 올바른지 확인하십시오. 합의 기준을 계산하는 데 필요한 값은 표에 나와 있습니다. 5.19.
표 5.19
피어슨 합의 기준 x2 및 Kolmogorov X 높이, cm 분포 계열의 빈도(/n - t")2 t" F F" k- p,\ t t" A 1 2 3 4 5 6 156을 결정하기 위한 값 계산 -160 8 5 1 .8 8 5 3 161-165 17 16 0.1 25 21 4 166-170 42 40 0.1 67 61 6 171-175 54 65 1.9 121 126 5 176-180 73 73 0 194 199 5 181-185 57 57 0 251 256 5 186-190 38 30 2.1 289 286 3 191-195 11 11 0 300 297 3 X 300 297 6.0 먼저 피어슨 기준을 계산해 봅시다.
그런 다음 유의 수준 a = 0.05를 선택하고 자유도 V를 결정합니다. 이 분포에는 8개의 그룹이 있고 연결(모수) 수는 3이므로 V = 8 - 3 = 5입니다. 표 사용 부록 4에서는 a = 0, 05 및 V = 5 Pearson 기준 %2 = 11.07을 찾습니다.
%2calc 이후 Romanovsky 기준을 사용하여 가설을 확인해 보겠습니다.
나는 X2 - V 나는 16.0 - 5 나는 1
kr = ] Г=^ = 1 = --г = 0.3.
Kp Romanovsky 기준은 또한 경험적 빈도와 이론적 빈도 사이의 불일치가 중요하지 않음을 확인합니다.
이제 Kolmogorov 기준 A의 적용을 고려해 보겠습니다. 표에서 볼 수 있듯이. 5.19에서 누적 빈도의 최대 차이는 6입니다. B = 확인!/1- P"\ = 6. 따라서 Kolmogorov 기준은
X = -?= = = 0.35.
부록 6의 표를 사용하여 X = 0.35: P(X) = 0.9997에서 확률 값을 찾습니다. 이는 확률이 1에 가까우면 정규 분포의 가설이 기각되지 않으며 경험적 분포와 이론적 분포 간의 불일치가 무작위라고 말할 수 있음을 의미합니다.
이제 알려진 적합도 기준을 사용하여 제시된 가설의 정확성을 확인한 후 분포 결과를 실제 활동에 사용할 수 있습니다.
예. 테이블의 데이터를 사용합니다. 5.18, 자동차의 결함 수 분포가 포아송 법칙을 따른다는 가설을 테스트합니다.
합의 기준을 결정하는 데 필요한 초기 데이터 및 값 계산이 표에 나와 있습니다. 5.20.
%2의 값을 계산해 보겠습니다: 2
다파쉬^/9
(표 5.20 참조) xX테이블 = 9>49
(부록 4 참조)
%2calc 따라서, 포아송의 법칙에 따른 자동차 결함 수 분포에 대한 가설은 기각되지 않습니다.
무작위성을 확인하고 이상치 관찰을 평가하는 기준 문헌 소개 실험 데이터의 통계 분석 실행에서 주요 관심은 특정 통계 자체의 계산이 아니라 이러한 유형의 질문에 대한 답변입니다. 따라서 제안된 통계 가설을 테스트하기 위해 많은 기준이 개발되었습니다. 통계적 가설을 테스트하기 위한 모든 기준은 두 가지로 나뉩니다. 대규모 그룹: 파라메트릭 및 비파라메트릭.
소셜 네트워크에서 작업을 공유하세요
이 작품이 당신에게 적합하지 않다면 페이지 하단에 유사한 작품 목록이 있습니다. 검색버튼을 이용해도 됩니다
동의 기준 사용
소개
문학
소개
실험 데이터의 통계 분석 실행에서 주요 관심은 특정 통계 자체의 계산이 아니라 이러한 유형의 질문에 대한 답변입니다. 모집단 평균이 실제로 특정 숫자와 같나요? 상관 계수가 0과 크게 다른가요? 두 표본의 분산이 동일한가요? 그리고 특정 연구 문제에 따라 그러한 질문이 많이 발생할 수 있습니다. 따라서 제안된 통계 가설을 테스트하기 위해 많은 기준이 개발되었습니다. 우리는 가장 일반적인 것 중 일부를 고려할 것입니다. 이는 주로 평균, 분산, 상관 계수 및 풍부도 분포와 관련됩니다.
통계적 가설을 테스트하기 위한 모든 기준은 모수적 및 비모수적이라는 두 가지 큰 그룹으로 나뉩니다. 모수적 테스트는 표본 데이터가 알려진 분포를 가진 모집단에서 추출되었다는 가정을 기반으로 하며 주요 작업은 이 분포의 모수를 추정하는 것입니다. 비모수적 테스트에는 분포가 연속적이라는 가정 외에 분포의 특성에 대한 어떠한 가정도 필요하지 않습니다.
먼저 매개변수 기준을 살펴보겠습니다. 테스트 시퀀스에는 귀무가설과 대립가설의 공식화, 가정의 공식화, 테스트에 사용된 샘플 통계의 결정, 테스트 중인 통계의 샘플 분포 구성, 선택한 기준에 대한 임계 영역 결정 및 샘플 통계에 대한 신뢰 구간 구성.
1 평균의 적합도 기준
테스트할 가설을 모집단 매개변수로 설정합니다. 예를 들어 다음과 같은 상황에서 이러한 확인이 필요할 수 있습니다. 광범위한 연구를 바탕으로 어떤 고정된 위치의 퇴적물에 있는 연체동물 화석 껍질의 직경이 확립되었다고 가정해 보겠습니다. 또한 다른 장소에서 발견된 특정 수의 껍질을 마음대로 사용할 수 있고 특정 장소가 껍질의 직경에 영향을 미치지 않는다고 가정합니다. 한때 새로운 장소에 살았던 전체 연체동물 개체군에 대한 껍질 직경의 평균 값은 첫 번째 서식지에서 이러한 유형의 연체동물을 연구할 때 이전에 얻은 알려진 값과 동일합니다.
이 경우 알려진 값같다면 귀무가설과 대립가설은 다음과 같이 작성된다. 고려 중인 모집단의 변수 x가 정규분포를 가지며 모집단의 분산은 알 수 없다고 가정하자.
통계를 사용하여 가설을 테스트하겠습니다.
, (1)
표본 표준편차는 어디에 있습니까?
만약 참이라면 식 (1)의 t는 자유도가 n-1인 스튜던트 t-분포를 갖는 것으로 나타났습니다. 유의 수준(올바른 가설을 기각할 확률)을 동일하게 선택하면 이전 장에서 논의한 내용에 따라 검정에 대한 임계값 =0을 결정할 수 있습니다.
이 경우 스튜던트 분포는 대칭이므로 n-1 자유도를 갖는 이 분포 곡선 아래 영역의 (1-) 부분이 점 사이에 포함되며 절대값이 서로 동일합니다. . 따라서 선택한 유의 수준에서 주어진 자유도를 갖는 t-분포에 대해 음수보다 작고 양수 값보다 큰 모든 값이 임계 영역을 구성합니다. 표본 t 값이 이 영역에 속하면 대립 가설이 채택됩니다.
에 대한 신뢰 구간은 이전에 설명한 방법을 사용하여 구성되며 다음 식으로 결정됩니다.
(2)
따라서 우리의 경우 화석 연체동물 껍질의 직경이 18.2mm임을 알려드립니다. 우리는 mm, a = 2.18mm인 새로 발견된 50개의 껍질 샘플을 처분할 수 있었습니다. 확인해 보겠습니다: =18.2 반대
유의 수준 =0.05를 선택하면 임계값입니다. 유의수준=0.05에서는 기각될 수 있다는 결론이 나온다. 따라서 우리의 가상적인 예에서 특정 종의 화석 연체동물 껍질의 직경은 그들이 살았던 장소에 따라 다르다고 (물론 어느 정도 확률로) 주장할 수 있습니다.
t-분포가 대칭이라는 사실로 인해 이 분포의 양의 t 값만 선택한 유의 수준과 자유도에서 제공됩니다. 더욱이, t 값의 오른쪽에 있는 분포 곡선 아래 영역의 점유율뿐만 아니라 동시에 -t 값의 왼쪽에 있는 영역의 비율도 고려됩니다. 이는 대부분의 경우 가설을 테스트할 때 이러한 편차가 더 크거나 작은지 여부에 관계없이 편차 자체의 중요성에 관심이 있기 때문입니다. 우리는 다음을 확인합니다. >a 또는: 이제 우리의 예로 돌아가 보겠습니다. 에 대한 100(1-)% 신뢰 구간은 다음과 같습니다. 18,92,01
이제 두 일반 모집단의 평균을 비교해야 하는 경우를 고려해 보겠습니다. 테스트 중인 가설은 다음과 같습니다: : =0, : 0. 또한 평균과 분산이 있는 정규 분포와 평균과 동일한 분산이 있는 정규 분포가 있다고 가정합니다. 또한, 일반 모집단을 추정하는 표본은 서로 독립적으로 추출되어 각각 일정한 양을 가지고 있다고 가정하고, 표본의 독립성으로부터 더 많은 수를 취하여 평균을 계산하면 다음과 같이 됩니다. 각 쌍에 대한 값이 있으면 이러한 평균 쌍 세트는 완전히 상관 관계가 없습니다. 귀무가설 검정은 통계를 사용하여 수행됩니다. (3)
여기서 와 는 각각 첫 번째 샘플과 두 번째 샘플에 대한 분산 추정값입니다. (3)은 (1)의 일반화임을 쉽게 알 수 있다. 통계(3)에는 자유도가 있는 스튜던트 t-분포가 있는 것으로 나타났습니다. 와 가 같다면, 즉 == 공식 (3)은 단순화되어 다음과 같은 형식을 갖습니다. (4)
예를 살펴보겠습니다. 두 계절에 걸쳐 동일한 식물 집단의 줄기 잎을 측정할 때 다음과 같은 결과가 얻어졌다고 가정합니다. 스튜던트 t-검정을 사용하기 위한 조건, 즉 표본을 추출한 모집단의 정규성, 알려지지 않았지만 이러한 모집단에 대한 분산은 동일하고 표본의 독립성이 충족됩니다. 유의수준=0.01로 추정해보자. 우리는 테이블 값 t = 2.58. 따라서 두 계절에 걸쳐 식물 개체군에 대한 줄기 잎 길이의 평균값이 동일하다는 가설은 선택한 유의 수준에서 기각되어야 합니다. 주목! 수학적 통계의 귀무 가설은 평균, 분산 또는 기타 통계에 관계없이 비교된 지표 간에 유의미한 차이가 없다는 가설입니다. 그리고 이 모든 경우에 기준의 경험적(공식으로 계산된) 값이 이론적인(표에서 선택한) 값보다 크면 해당 기준은 거부됩니다. 경험적 값이 표로 표시된 값보다 작으면 해당 값이 허용됩니다. 이 두 모집단의 평균 차이에 대한 신뢰 구간을 구성하기 위해 공식 (3)에서 볼 수 있듯이 스튜던트 테스트가 상대 평균 간의 차이의 중요성을 평가한다는 사실에 주목합시다. 이 차이를 표준오차로 환산합니다. (3)의 분모가 이전에 논의된 관계와 가정을 사용하여 정확히 이 표준 오류를 나타내는지 쉽게 확인할 수 있습니다. 사실 우리는 일반적으로 알고 있는 x와 y가 독립이면 독립이다. x와 y 대신 표본 값을 취하고 두 모집단의 분산이 동일하다는 가정을 상기하면 다음을 얻습니다. (5)
분산 추정치는 다음 관계식으로부터 얻을 수 있습니다. (6)
(표본에서 2개의 양이 추정되므로 자유도가 2로 줄어들기 때문에 로 나눕니다.) 이제 (6)을 (5)에 대입하고 제곱근을 취하면 식 (3)에서 분모를 얻게 됩니다. 이 여담 후에는 ~에 대한 신뢰 구간을 구성하는 것으로 돌아가겠습니다. 우리는 t-검정을 구성하는 데 사용된 가정과 관련하여 몇 가지 설명을 해보겠습니다. 우선, 정규성 가정 위반은 30에 대한 검정의 유의성과 검정력에 미미한 영향을 미치는 것으로 나타났습니다. 표본을 추출한 두 모집단의 분산 동질성 가정 위반은 다음과 같습니다. 또한 중요하지 않지만 표본 크기가 동일한 경우에만 해당됩니다. 두 모집단의 분산이 서로 다른 경우 첫 번째 및 두 번째 유형의 오류 확률은 예상한 것과 크게 다를 것입니다. 이 경우 기준을 사용하여 확인해야 합니다. (7)
자유도의 수와 함께 . (8)
원칙적으로는 분수로 나타나므로 t-분포표를 사용하는 경우에는 가장 가까운 정수값에 대한 테이블 값을 취하고 보간하여 t에 해당하는 t를 찾아야 합니다. 하나 얻었습니다. 예를 살펴보겠습니다. 호수개구리의 두 아종을 연구할 때 몸 길이와 경골 길이의 비율이 계산되었습니다. 부피 =49 및 =27로 두 개의 샘플을 채취했습니다. 우리가 관심을 갖고 있는 관계의 평균과 분산은 각각 =2.34로 나타났습니다. =2.08; =0.21; =0.35. 이제 공식 (2)를 사용하여 가설을 테스트하면 다음을 얻습니다. 유의 수준 =0.05에서 귀무 가설(표 값 t = 1.995)을 기각하고 두 개구리 아종에 대해 측정된 매개변수의 평균값 사이에 선택된 유의 수준에서 통계적으로 유의미한 차이가 있다고 가정해야 합니다. . 공식 (6)과 (7)을 사용할 때 우리는 이 경우 동일한 유의수준 =0.05에 대해 테이블 값은 t=2.015이고 귀무가설이 채택된다. 이 예는 특정 기준을 도출할 때 채택한 조건을 무시하면 실제로 발생하는 것과 정반대의 결과를 초래할 수 있음을 명확하게 보여줍니다. 물론 이 경우 두 모집단에서 측정된 지표의 분산이 통계적으로 동일하다는 사전 확립된 사실이 없는 상태에서 서로 다른 크기의 샘플을 사용하려면 공식 (7)과 (8)을 사용해야 했습니다. 통계적으로 유의한 차이가 없는 것으로 나타났다. 따라서 특정 기준을 도출할 때 모든 가정을 준수하는지 확인하는 것이 올바른 사용을 위해 절대적으로 필요한 조건임을 다시 한 번 반복하고 싶습니다. 위의 t-검정 수정 모두에서 일정한 요구 사항은 표본이 서로 독립적이어야 한다는 요구 사항이었습니다. 그러나 실제로는 객관적인 이유로 이 요구 사항을 충족할 수 없는 상황이 종종 있습니다. 예를 들어, 일부 지표는 외부 요인 등의 작용 전후에 동일한 동물이나 영토 영역에서 측정됩니다. 그리고 이러한 경우에 우리는 가설을 테스트하는 데 관심이 있을 수 있습니다. 두 표본 모두 동일한 분산을 갖는 정규 모집단에서 추출되었다고 계속 가정하겠습니다. 이 경우 정규분포된 양의 차이도 정규분포를 갖는다는 사실을 활용할 수 있으므로 (1) 형식의 스튜던트 t 테스트를 사용할 수 있습니다. 따라서 n개의 차이는 평균이 0인 정규 분포 모집단의 표본이라는 가설이 테스트됩니다. i번째 차이를 다음과 같이 나타냅니다. , (9) 예를 살펴보겠습니다. 자극 작용 전()과 후()의 특정 시간 간격 동안 개별 신경 세포의 자극 수에 대한 데이터를 마음대로 확보해 보겠습니다. 따라서 (9)가 t-분포를 갖는다는 점을 염두에 두고 유의 수준 =0.01을 선택하면 부록의 해당 표에서 n-1=10-1=9도에 대한 t의 임계값을 알 수 있습니다. 자유도는 3.25이다. 이론적 및 경험적 t-통계량 값을 비교하면 자극 전후의 발사 속도 간에 통계적으로 유의미한 차이가 없다는 귀무 가설이 기각되어야 함을 알 수 있습니다. 사용된 자극이 자극의 빈도를 통계적으로 유의하게 변화시킨다는 결론을 내릴 수 있습니다. 실험 연구에서는 위에서 언급한 것처럼 종속 표본이 자주 나타납니다. 그러나 이 사실은 때때로 무시되고 t-검정은 형식 (3)에서 잘못 사용됩니다. 이것의 부적절함은 상관되지 않은 평균과 상관된 평균 사이의 차이에 대한 표준 오차를 고려하면 알 수 있습니다. 첫 번째 경우 그리고 두 번째에는 차이 d의 표준 오차는 다음과 같습니다. 이를 고려하면 (9)의 분모는 다음과 같은 형식을 갖게 됩니다. 이제 식 (4)와 (9)의 분자가 일치한다는 사실에 주목합시다. 따라서 t 값의 차이는 분모에 따라 다릅니다. 따라서 종속 샘플 문제에 공식 (3)을 사용하고 샘플에 양의 상관 관계가 있으면 결과 t 값이 공식 (9)를 사용할 때보다 작아지고 상황이 발생할 수 있습니다. 여기서 귀무가설은 거짓일 때 채택됩니다. 표본 간에 음의 상관관계가 있는 경우 반대 상황이 발생할 수 있습니다. 이 경우 차이점은 실제로는 중요하지 않은 것으로 인식됩니다. 임펄스 활동이 있는 예로 다시 돌아가서 샘플이 관련되어 있다는 사실에 주의하지 않고 공식 (3)을 사용하여 주어진 데이터에 대한 t 값을 계산해 보겠습니다. 자유도가 18이고 유의수준이 0.01인 경우 테이블 값은 t = 2.88이며 언뜻 보기에 적합하지 않은 수식을 사용해도 아무 일도 일어나지 않은 것처럼 보입니다. 주어진 조건. 그리고 이 경우 계산된 t 값은 귀무가설을 기각하게 됩니다. 즉, 이 상황에서는 공식 (9)를 사용하여 얻은 것과 동일한 결론을 얻습니다. 그러나 기존 데이터를 다시 형식화하여 다음과 같은 형태로 제시해보자(2). 이는 동일한 값이며 실험 중 하나에서 얻을 수 있습니다. 두 샘플의 모든 값이 보존되므로 식(3)의 스튜던트 t 검정을 사용하면 이전에 얻은 값 = 3.32가 되며 이미 내린 것과 동일한 결론에 도달합니다. 이제 이 경우에 사용되는 식 (9)를 이용하여 t의 값을 계산해 보자. 선택한 유의 수준과 9자유도에서 t의 임계값은 3.25입니다. 결과적으로 우리는 귀무가설을 기각할 이유가 없으며 이를 받아들인다. 그리고 이 결론은 식 (3)을 사용할 때 도출된 결론과 정반대라는 것이 밝혀졌다. 이 예를 통해 우리는 실험 데이터를 분석할 때 올바른 결론을 얻기 위해 특정 기준을 결정하는 기초가 되는 모든 요구 사항을 엄격하게 준수하는 것이 얼마나 중요한지 다시 한 번 확신했습니다. 학생 테스트의 고려된 수정은 두 샘플의 평균에 관한 가설을 테스트하기 위한 것입니다. 그러나 동시에 k 평균의 동등성에 관한 결론을 도출해야 하는 상황이 발생합니다. 이 경우 특정 통계 절차도 개발되었으며 이는 나중에 분산 분석과 관련된 문제를 논의할 때 논의될 것입니다. 2 분산에 대한 적합도 검정 모집단 분산에 관한 통계적 가설 검정은 평균과 동일한 순서로 수행됩니다. 이 순서를 간단히 기억해 보겠습니다. 1. 귀무가설(비교된 분산 사이에 통계적으로 유의미한 차이가 없음에 대한)이 공식화됩니다. 2. 가설에 포함된 모수를 추정하기 위해 계획된 통계의 표본분포에 대해 몇 가지 가정을 하고 있다. 3. 가설 검정을 위한 유의 수준을 선택합니다. 4. 우리가 관심 있는 통계값을 계산하고 귀무가설의 참 여부에 대한 결정을 내립니다. 이제 모집단의 분산 =a라는 가설을 테스트하는 것부터 시작해 보겠습니다. 에 맞서. 변수 x가 정규 분포를 갖고 크기 n의 표본이 모집단에서 무작위로 추출되었다고 가정하면 통계를 사용하여 귀무 가설을 테스트합니다. (10)
분산 계산 공식을 기억하여 (10)을 다음과 같이 다시 작성합니다. . (11)
이 표현에서 분자는 평균에서 정규 분포 값의 편차의 제곱의 합이라는 것이 분명합니다. 이러한 각 편차도 정규 분포를 따릅니다. 따라서 우리에게 알려진 분포에 따르면 통계 (10)과 (11)의 정규 분포 값의 제곱합은 n-1 자유도를 갖는 -분포를 갖습니다. t-분포의 사용과 유사하게 선택된 유의 수준을 확인할 때 귀무 가설을 받아들일 확률에 해당하는 분포표에서 임계점이 설정됩니다. 선택된 시점에 대한 신뢰 구간은 다음과 같이 구성됩니다. . (12)
예를 살펴보겠습니다. 광범위한 실험 연구를 바탕으로 특정 지역에서 한 식물종의 알칼로이드 함량 분산이 4.37 기존 단위와 같다고 가정해 보겠습니다. 전문가는 아마도 동일한 지역에서 온 것으로 추정되는 n = 28개의 식물 샘플을 마음대로 사용할 수 있습니다. 분석에 따르면 이 표본 =5.01에 대해 이 분산과 이전에 알려진 분산이 유의 수준 =0.1에서 통계적으로 구별할 수 없는지 확인하는 것이 필요합니다. 공식 (10)에 따르면 우리는 결과 값은 임계값 /2=0.05 및 1--/2=0.95와 비교되어야 합니다. 27 자유도에 대한 부록 표에서 우리는 각각 40.1과 16.2를 얻었으며 이는 귀무 가설이 허용될 수 있음을 의미합니다. 해당 신뢰 구간은 3.37입니다.<<8,35.
표본평균에 대한 가설을 스튜던트 검정을 이용하여 검정하는 것과 달리, 모집단의 정규분포 가정을 위반한 경우 첫 번째, 두 번째 유형의 오류가 크게 변하지 않은 경우, 정규성 조건을 만족하지 않는 경우의 분산에 관한 가설의 경우 만났을 때 오류가 크게 변경되었습니다. 고정된 값에 대한 분산의 동일성에 관해 위에서 고려한 문제는 모집단의 분산이 알려진 경우 상황이 매우 드물기 때문에 관심이 제한적입니다. 훨씬 더 흥미로운 것은 두 모집단의 분산이 동일한지 확인해야 하는 경우입니다. 대안에 대한 가설을 테스트합니다. 크기의 표본은 분산이 있는 일반 모집단에서 무작위로 추출된 것으로 가정됩니다. 귀무 가설을 검정하기 위해 Fisher의 분산 비율 검정이 사용됩니다. (13)
정규분포 확률변수의 평균과 편차의 제곱합은 분포를 가지므로 (13)의 분자와 분모는 모두 와 각각으로 나누어진 분포값이므로 그 비율은 -1과 를 갖는 F-분포를 갖는다. -1 자유도. F-분포표가 구성되는 방식은 일반적으로 (13)에서 가장 큰 분산을 분자로 사용하므로 선택된 유의 수준에 해당하는 하나의 임계점만 결정된다는 것이 일반적으로 받아들여집니다. 높이 대 너비 비율의 분산이 0.59 및 0.38인 일반 및 타원형 연못 달팽이 개체군에서 볼륨 =11 및 =28의 두 샘플을 마음대로 사용할 수 있습니다. =0.05의 유의 수준에서 연구 중인 모집단에 대해 이러한 지표의 이러한 분산이 동일하다는 가설을 테스트할 필요가 있습니다. 우리는 문헌에서 스튜던트 검정을 사용하여 평균의 동일성에 대한 가설을 검정하기 전에 분산의 동일성에 대한 가설을 검정해야 한다는 진술을 때때로 찾을 수 있습니다. 잘못된 추천입니다. 게다가, 따르지 않으면 피할 수 있는 실수로 이어질 수도 있습니다. 실제로 Fisher의 검정을 사용하여 등분산 가설을 검정한 결과는 표본이 정규 분포를 따르는 모집단에서 추출되었다는 가정에 크게 좌우됩니다. 동시에, 스튜던트 테스트는 정규성 위반에 둔감하며 동일한 크기의 표본을 얻을 수 있는 경우 등분산 가정도 중요하지 않습니다. n이 같지 않은 경우, 검증을 위해 공식 (7)과 (8)을 사용해야 합니다. 등분산에 대한 가설을 테스트할 때 종속 표본과 관련된 계산에서 일부 기능이 발생합니다. 이 경우 통계는 대안에 대한 가설을 테스트하는 데 사용됩니다. (14)
귀무가설이 참이면 통계(14)는 자유도가 n-2인 스튜던트 t-분포를 갖습니다. 35개 코팅 샘플의 광택을 측정했을 때 =134.5의 분산도가 얻어졌습니다. 2주 후에 반복 측정한 결과 =199.1로 나타났습니다. 이 경우, 쌍을 이루는 측정값 간의 상관계수는 =0.876으로 나타났습니다. 표본이 종속적이라는 사실을 무시하고 Fisher 테스트를 사용하여 가설을 테스트하면 F=1.48을 얻습니다. 유의 수준 =0.05를 선택하면 =35-1=34 및 =35-1=34 자유도에 대한 F-분포의 임계값이 1.79이므로 귀무 가설이 허용됩니다. 동시에, 이 경우에 적합한 식 (14)를 사용하면 t = 2.35를 얻는 반면, 33 자유도 및 선택된 유의 수준 = 0.05에 대한 t의 임계값은 2.03과 같습니다. 따라서 두 표본의 등분산에 대한 귀무가설은 기각되어야 합니다. 따라서 이 예에서 평균 평등 가설을 테스트하는 경우와 마찬가지로 실험 데이터의 세부 사항을 고려하지 않은 기준을 사용하면 오류가 발생한다는 것이 분명합니다. 권장 문헌에서는 k 분산의 동시 동일성에 대한 가설을 테스트하는 데 사용되는 Bartlett 테스트를 찾을 수 있습니다. 이 기준의 통계를 계산하는 것이 매우 힘들다는 사실 외에도 이 기준의 주요 단점은 표본이 추출되는 모집단의 정규 분포 가정으로부터의 편차에 매우 민감하다는 것입니다. 따라서 이를 사용할 때 표본이 정규 분포를 따르지 않아서가 아니라 분산이 통계적으로 유의미하게 다르기 때문에 귀무 가설이 실제로 기각되었다고 확신할 수 없습니다. 따라서 여러 분산을 비교하는 문제가 발생하면 Fisher 기준이나 그 수정을 사용할 수 있는 문제의 공식화를 찾아야 합니다. 3 주식에 관한 합의의 기준 개체를 두 가지 범주 중 하나로 분류할 수 있는 모집단을 분석해야 하는 경우가 많습니다. 예를 들어, 특정 인구의 성별, 토양에 특정 미량 원소의 존재, 일부 새 종의 알이 어둡거나 밝은 색 등에 따라 다릅니다. 특정 품질을 가진 요소의 비율을 P로 표시합니다. 여기서 P는 전체 개체 중 우리가 관심 있는 품질을 가진 개체의 비율을 나타냅니다.
어디