확률 변수의 가능한 모든 값의 집합이 호출됩니다. 임의의 값

이 법칙을 지정하는 가장 간단한 형태는 확률 변수의 가능한 값과 해당 확률을 나열한 표입니다.

이러한 테이블을 확률 변수 X의 분포 계열이라고 합니다.


0x1x2x3x4x5x6

유통 기능

분포 법칙은 이산 확률 변수의 완전하고 철저한 특성입니다. 그러나 연속확률변수에는 적용할 수 없기 때문에 보편적이지 않습니다. 연속확률변수는 무한한 수의 값을 취하여 특정 구간을 채웁니다. 연속확률변수의 값을 모두 포함하는 테이블을 만드는 것은 거의 불가능합니다. 결과적으로, 연속 확률 변수의 경우 이산 확률 변수에 존재하는 것과 같은 의미에서 분포 법칙이 없습니다.

연속 확률 변수를 설명하는 방법은 무엇입니까?

이 목적을 위해 사용되는 것은 사건 X = x의 확률이 아니라 사건 X의 확률입니다.<х, где х - некоторая переменная. Вероятность этого события зависит от х и является функцией х.

이 함수는 분포 함수 확률 변수 X는 다음과 같이 표시됩니다. 에프엑스(x):

에프(엑스)=피(엑스

분포함수는 확률변수의 보편적 특성입니다. 이산형 및 연속형 임의 변수에 대해 존재합니다.

분포 함수의 속성:

1. x 1 > x 2일 때 에프(x 1)> 에프(x 2)

2. F(-무한대)=0

3. 에프(+무한대)=1

이산확률변수의 분포함수는 불연속 계단함수로, 확률변수의 가능한 값에 해당하는 지점에서 점프가 발생하고 이 값의 확률과 같습니다. 이 점프의 합은 1과 같습니다.

1 에프엑스(F(x))





확률변수의 수치적 특성.

이산확률변수의 주요 특징은 다음과 같습니다.

· 유통 기능;

· 배포 범위;

연속 확률 변수의 경우:

· 유통 기능;

· 분포 밀도.

모든 법칙은 일부 함수를 나타내며 이 함수의 표시는 확률 변수를 완전히 설명합니다.

그러나 숫자를 결정함에 있어 실질적인 문제확률변수를 전체적으로 특성화하는 것이 항상 필요한 것은 아닙니다. 랜덤 변수를 특징짓는 일부 수치 매개변수만 표시하는 것으로 충분합니다.

분포의 가장 중요한 특징을 집중된 형태로 표현하는 것이 목적인 이러한 특성을 다음과 같이 부릅니다. 확률변수의 수치적 특성.

위치 특성

(MOJ, 최빈값, 중앙값)

사용되는 확률 변수의 모든 수치 특성 중에서 수치 축에서 확률 변수의 위치를 ​​설명하는 특성이 가장 자주 사용됩니다. 즉, 확률 변수의 가능한 값을 그룹화하는 평균 값을 나타냅니다.

이를 위해 다음과 같은 특성이 사용됩니다.

· 기대값;

· 중앙값.

수학적 기대값(평균값)은 다음과 같이 계산됩니다.

엑스 1 아르 자형 1 +x 2 아르 자형 2 +….+x N아르 자형 n ∑ x 나는 р 나는

р 1 + р 2 + …..+р n n

고려해 보면 ∑ 피 , MOZ는 M[X] =와 같습니다. x 나는 파이

확률변수의 수학적 기대값은 확률변수의 가능한 모든 값과 이러한 값의 확률을 곱한 값의 합입니다.

위 공식은 이산확률변수에만 유효합니다.

연속 수량의 경우

M[엑스] = xf(x)dx, 어디 에프엑스(f(x)) - 분포 밀도 X.

존재하다 다양한 방법평균값 계산. 평균을 나타내는 가장 일반적인 형태는 다음과 같습니다. 산술 평균, 중앙값 및 최빈값.

산술 평균은 전체 값을 나누어 구합니다. 이 특성의전체 균질 통계 모집단에 대해 이 모집단의 단위 수로 표시됩니다. 산술 평균을 계산하려면 다음 공식이 사용됩니다.

Хср = (Х1+Х2+... +Хn):n,

여기서 Xi는 인구의 i번째 단위의 특성 값이고, n은 인구의 단위 수입니다.

패션확률 변수를 가장 가능성 있는 값이라고 합니다.



중앙값 주문한 계열의 중간에 위치한 값입니다. 계열의 단위 수가 홀수인 경우 중앙값은 고유하며 계열의 정확히 중앙에 위치하며, 짝수인 경우 중앙 위치를 차지하는 인구 중 인접한 두 단위의 평균값으로 정의됩니다.

통계대량 현상의 정량적 측면을 연구하는 과학의 한 분야입니다. 공공 생활, 개별 요소, 단위로 구성됩니다. 요소들의 조합은 통계적 모집단을 구성합니다. 연구의 목적은 이 현상의 발전에 대한 정량적 패턴을 확립하는 것입니다. 이는 확률 이론과 대수의 법칙을 적용한 것입니다. 이 법칙의 본질은 집합체의 개별 요소의 개별적인 무작위 변동에도 불구하고 주어진 집합체 전체의 특징인 특정 패턴이 전체 질량에 나타난다는 것입니다. 연구 중인 현상을 특징짓는 개별 요소의 수가 많을수록 이 현상에 내재된 패턴이 더 명확하게 드러납니다.

범죄는 사회적, 대중적 현상이며, 개별 범죄 징후의 수많은 사실을 통계적으로 집계한 것입니다. 이는 통계 이론의 방법을 사용하여 연구할 수 있는 근거를 제공합니다.

사회 현상에 대한 통계적 연구에서는 세 단계로 구분할 수 있습니다.

1) 통계적 관찰, 즉 1차 통계 자료 수집;

2) 수집된 데이터의 요약 처리, 결과가 계산되는 동안 요약(요약) 지표가 계산되고 결과가 표와 그래프 형식으로 표시됩니다.

3) 연구중인 통계 인구의 패턴, 다양한 구성 요소 간의 관계 및 일반화 지표에 대한 의미있는 해석이 식별되는 분석이 수행됩니다.

통계연구의 첫 번째 단계는 통계적 관찰이다. 데이터 수집 과정에서 발생한 오류는 추가 작업 단계에서 수정이 거의 불가능하여 궁극적으로 연구 중인 현상의 속성과 잘못된 해석에 대한 잘못된 결론을 수반하기 때문에 특별한 역할을 합니다.

통계적 관찰은 사실을 기록하는 방식에 따라 연속적 관찰과 불연속적 관찰로 나누어진다. 연속적 또는 현재라는 말은 사실이 발생할 때마다 사실의 확립과 확인이 수행되는 관찰을 의미합니다. 지속적인 관찰을 통해 사실은 일정한 간격으로 정기적으로 또는 필요에 따라 기록됩니다.

조사 대상 인구 단위의 범위에 따라 연속 관찰과 비연속 관찰이 구별됩니다. 연속 관찰은 연구 대상 모집단의 모든 단위가 기록 대상이 되는 관찰입니다. 예를 들어, 범죄 등록은 이론적으로 지속적인 관찰을 의미합니다. 그러나 실제로는 잠재 범죄라고 불리는 특정 범죄 부분이 연구 대상 통계 인구 범위를 벗어나므로 실제로 그러한 관찰은 불완전합니다. 불완전한 관찰은 연구 대상 모집단의 모든 단위가 등록 대상이 아닌 관찰입니다. 이는 메인 어레이 관찰, 선택적 관찰 및 기타 여러 유형으로 나뉩니다.

주 배열의 관찰(때때로 불완전 연속 방법이라고도 함)은 물체의 전체 단위 집합 중 압도적이고 지배적인 점유율을 구성하는 부분이 관찰되는 비연속 관찰의 한 유형입니다. 전체 세트. 이 방법을 사용하여 관찰을 수행하는 것은 인구의 모든 단위를 완전히 포함하는 것이 특별한 어려움과 동시에 관찰에서 특정 수의 단위를 제외하는 것이 특성에 대한 결론에 큰 영향을 미치지 않는 경우에 실행됩니다. 전체 인구. 따라서 범죄 등록은 특히 이러한 유형의 관찰에 기인할 가능성이 높습니다.

비연속 관찰의 가장 진보된 유형은 표본 추출로, 전체 모집단의 특성을 파악하기 위해 모집단의 특정 부분만 검사하되 특정 규칙에 따라 표본을 추출합니다. 표본 관찰 수행의 정확성을 위한 주요 조건은 그러한 선택이며, 그 결과 연구할 모든 특성에 대해 선택된 단위 부분이 전체 인구 전체를 충분히 정확하게 특성화할 것입니다. 대부분의 경우 표본 관찰은 사회학 연구에 사용됩니다. 앞으로는 선택적 관찰 시 단위를 선택하는 규칙과 방법을 고려해 보겠습니다.

1차 자료를 수집하고 검증한 후 2단계 통계조사를 진행합니다. 통계적 관찰은 연구 대상의 개별 단위를 특성화하는 자료를 제공합니다. 요약의 임무는 관찰 결과를 요약, 체계화 및 일반화하여 특징적인 특징과 필수 속성을 식별하고 연구 중인 현상과 과정의 패턴을 발견하는 것이 가능해지게 하는 것입니다.

요약의 가장 간단한 예는 보고된 모든 범죄의 합계입니다. 그러나 그러한 일반화는 범죄 상황의 모든 속성에 대한 완전한 그림을 제공하지 않습니다. 범죄를 심층적이고 종합적으로 특성화하기 위해서는 범죄의 종류, 시기, 장소, 범행방법 등에 따라 전체 범죄 건수가 어떻게 분포되어 있는지를 알아야 한다.

연구 대상 개체의 단위를 본질적인 특성에 따라 동질적인 그룹으로 분포하는 것을 통계적 그룹화라고 합니다. 통계에 의해 연구된 객체는 일반적으로 표현된 많은 속성과 관계로 특징지어집니다. 다양한 표지판. 따라서 연구 대상의 그룹화는 이러한 특성 중 하나 이상에 따라 통계 연구의 목적에 따라 수행될 수 있습니다. 따라서 기관의 직원은 직위, 특별 직급, 연령, 근속 기간, 결혼 여부 등에 따라 그룹화될 수 있습니다.

1차 통계 자료를 처리하고 체계화한 결과, 연구 중인 현상이나 프로세스의 개별 측면 또는 그 변화를 특성화하는 일련의 디지털 지표가 얻어집니다. 이 행을 통계적.내용에 따라 통계 시리즈는 두 가지 유형으로 나뉩니다. 디스트리뷰션 시리즈와 다이나믹스 시리즈.분포 계열은 특정 특성에 따라 원래 모집단 단위의 분포를 특성화하는 계열이며, 그 변종은 특정 순서로 배열됩니다. 예를 들어, 총 범죄 수의 분포는 다음과 같습니다. 개별 종, 직급별 전체 인원수는 분포 행이다.

동적 계열은 시간이 지남에 따라 사회 현상의 크기 변화를 특성화하는 계열입니다. 이러한 시리즈에 대한 자세한 고찰과 범죄 상황의 분석 및 예측에 대한 활용은 별도의 강의 주제입니다.

통계적 관찰 결과와 그 자료의 요약은 주로 절대값(지표)으로 표현됩니다. 절대값은 범죄 건수나 범죄를 저지른 사람 수, 실제 인력 수, 차량 수 등 주어진 장소와 시간 조건에서 사회 현상의 크기를 나타냅니다. 절대값은 개별값과 전체값(즉, 전체값)으로 구분됩니다. 개인은 특정 개체 집합의 개별 단위의 정량적 특성 크기를 나타내는 절대 값입니다(예: 특정 형사 사건의 피해자 수 또는 물질적 피해, 특정 직원의 연령 또는 근속 기간, 그의 급여 등). 이는 통계 관찰 과정에서 직접 획득되며 기본 회계 문서에 기록됩니다. 개별 절대값은 모든 통계 연구의 기초로 사용됩니다.

개별 절대값과 달리 총 절대값은 통계적 관찰이 적용되는 특정 개체 집합에 대한 특성의 최종 값을 나타냅니다. 이는 관찰 단위 수(예: 특정 유형의 범죄 수)를 직접 계산하거나 인구의 개별 단위 속성 값(예: 피해로 인한 피해)을 합산하여 얻습니다. 모든 범죄로).

그러나 그 자체로 취하는 절대값은 연구 중인 현상과 과정에 대한 올바른 아이디어를 항상 제공하는 것은 아닙니다. 따라서 절대값과 함께 큰 중요성통계에서는 상대적인 값을 갖습니다.

비교는 통계 데이터를 평가하는 주요 기술이며, 중요한 부분분석의 모든 방법. 그러나 단순히 두 수량을 비교하는 것만으로는 두 수량의 관계를 정확하게 평가할 수 없습니다. 이 비율도 측정해야 합니다. 그러한 관계를 측정하는 역할은 상대적 수량에 의해 수행됩니다.

절대값과 달리 상대값은 파생된 지표입니다. 이는 단순한 합산의 결과가 아니라 절대값을 서로 상대적(다중) 비교하여 얻습니다.

연구되는 현상의 성격과 연구의 구체적인 목적에 따라 상대값의 형태가 다를 수 있습니다( 모습) 표현. 상대량을 표현하는 가장 간단한 형태는 비교의 기초로 사용되는 한 양이 다른 양보다 몇 배 더 큰지, 또는 그것이 어떤 부분을 구성하는지를 나타내는 숫자(정수 또는 분수)입니다.

대부분의 경우 내무 기관의 분석 활동에서는 상대 숫자를 나타내는 또 다른 형태인 백분율 비율이 사용되며 기본 값은 100으로 간주됩니다. 백분율 비율을 결정하려면 나누기 결과를 곱해야 합니다. 하나의 절대값을 다른 값(기본값)으로 100으로 늘립니다.

통계 데이터의 요약 처리에서 중요한 역할은 평균값에 속합니다. 통계 모집단의 각 개별 단위는 양적 가치가 다른 개별 특성을 가지고 있기 때문에 전체 통계 모집단의 속성을 특성화하기 위해 사용됩니다. 평균값 . 통계에서 평균값은 동종 인구의 단위당 값으로 변수 변수의 수준을 반영하는 지표로 이해됩니다.

통계적 모집단의 동질성을 특성화하기 위해

관련 기준에 따라 다양한 지표가 사용됩니다. 변형, 분산, 표준편차. 이러한 지표를 사용하면 해당 평균값이 전체 모집단의 특성을 어느 정도 반영하는지, 그리고 해당 평균값이 특정 통계 모집단의 일반화 특성으로 사용될 수 있는지 여부를 평가할 수 있습니다. 나열된 지표에 대한 자세한 고려는 별도의 문제입니다.

위험 상황에서 우리는 하나 또는 다른 대안의 결과와 이러한 결과가 발생할 확률을 알고 있습니다. 즉, 우리는 결과의 확률 분포를 알고 있으므로 다음 형식으로 표현(모델링)할 수 있습니다. 무작위 변수. 이 섹션에서는 이 책의 내용을 더 자세히 연구하는 데 필요한 무작위 변수 및 결정 방법에 대한 확률 이론의 정보를 기억할 것입니다.

고전적 정의에 따르면, 무작위 수량은 실험마다 값이 무작위로 달라질 수 있는 수량입니다. 즉, 각 "테스트"에서는 특정 세트에서 하나의 단일 값을 가져올 수 있습니다. 그러나 그것이 어떤 가치를 갖게 될지 정확히 예측하는 것은 불가능합니다.

확률 변수는 이산 변수와 연속 변수로 구분됩니다. 이산형 SV는 유한하거나 셀 수 있는 값 집합만 사용할 수 있습니다. 연속 SV는 무한 구간을 포함하여 닫힌 구간이나 열린 구간에서 어떤 값이든 취할 수 있습니다.

3.2.2. 확률변수의 분포 법칙

확률 변수는 분포 법칙에 따라 결정됩니다. 분배의 법칙다음과 같은 경우 지정된 것으로 간주됩니다.

  • 무작위 변수(무한 포함)의 가능한 값 집합 및
  • 무작위 변수가 이 집합의 임의 영역에 포함될 확률, 또는 그러한 확률을 계산할 수 있는 법칙(공식).

본질적으로 확률은 주어진 영역에 무작위 변수가 나타날 가능성을 나타내는 지표입니다.

확률을 결정하는 가장 일반적이고 광범위한 방법 다른 의미무작위 변수는 작업입니다 확률 분포 함수, 이는 다음과 같이 축약됩니다. 분포 함수.

확률 변수 X의 분포 함수는 SV가 특정 값 x보다 작은 값을 취할 확률을 지정하는 함수 F(x)입니다. 즉, 다음과 같습니다.

F(x) = P(X< x)

X("x big") - 무작위 변수를 나타냅니다.

x(“x small”)는 임의 변수의 가능한 값 집합 중 특정 값입니다.

분포함수는 감소하지 않습니다. x가 마이너스 무한대에 가까워질수록 0이 되는 경향이 있고, x가 플러스 무한대에 가까워지면 1이 되는 경향이 있습니다.

확률변수의 분포 법칙을 표현하는 형식은 다를 수 있으며 이산형 확률변수인지 연속형 확률변수인지에 따라 달라집니다.

분포 함수의 정의에 따라 다음과 같은 종속성이 발생합니다.

확률 변수가 a에서 b까지의 간격에서 값을 취할 확률:

P(a ≤ X< b) = F(b) - F(a)

확률변수가 a 이상의 값을 가질 확률:

3.2.3. 이산확률변수의 분포를 나타내는 방법

이산확률변수분포 함수나 분포 계열(표)로 완전히 지정할 수 있습니다. 이는 표, 분석 또는 그래픽 형식으로 표시될 수 있습니다.

확률 변수 X가 각각 25%, 35%, 40%의 확률로 3가지 가능한 값 25, 45, 50을 취할 수 있다고 가정합니다. 이 SV의 배포 시리즈는 다음과 같습니다.

특정 값을 초과하지 않을 확률을 나타내는 동일한 확률변수의 분포함수는 다음과 같이 쓸 수 있습니다.

그림 3.1은 이산 확률 변수 X의 분포 법칙을 지정하는 그래픽 방법을 보여줍니다.

그림 3.1.

확률 분포 계열 p j의 그래프에서 각 가능한 값 x j의 실현은 높이가 확률과 동일한 막대로 표시됩니다. 모든 M개의 막대(즉, 모든 확률)의 높이의 합은 x의 가능한 모든 값을 포괄하므로 1과 같습니다.

때로는 막대 대신 SV 값의 실현 확률을 연결하는 점선이 그려집니다.

이산형 확률 변수가 a보다 작은 값을 가질 확률은 a보다 작은 모든 결과의 확률의 합과 같습니다.

정의에 따르면 이는 x = a 지점에서의 분포 함수 값과 같습니다. x가 마이너스 무한대에서 플러스 무한대까지 모든 값을 "통과"할 때 좌표 평면에 분포 함수의 값을 플롯하면 분포 함수의 그래프가 표시됩니다. 개별 SV의 경우 계단형입니다. 마이너스 무한대에서 첫 번째 가능한 값 x 1까지의 간격에서는 이 간격에서 어떤 값도 허용할 수 없으므로 0과 같습니다.

다음으로, 각각의 가능한 값 xj는 이 값 pj의 발생 확률과 동일한 양만큼 분포 함수를 증가시킵니다. 두 개의 연속 값 x j와 x j+1 사이에는 x의 다른 가능한 값이 없고 점프가 발생하지 않기 때문에 분포 함수는 변경되지 않습니다. 결국 xM이 가능한 마지막 값 지점에서 확률값 pM만큼 점프가 발생하고 분포함수는 1과 같은 극한값에 도달하게 된다. 다음으로 그래프는 x축에 평행한 수준으로 이동합니다. 확률은 1보다 클 수 없기 때문에 결코 더 높이 올라가지 않습니다.

3.2.4. 연속확률변수의 분포를 나타내는 방법

연속확률변수또한 일반적으로 분석 형식으로 표시되는 분포 함수에 의해 제공됩니다. 또한 분포 함수 F(x)의 1차 도함수인 확률 밀도 함수 f(x)로 완전히 설명할 수 있습니다.

확률밀도함수는 음수가 아니며, 무한한 한계에 대한 적분은 1과 같습니다.

정규 법칙에 따라 분포되는 연속 확률 변수를 예로 들어 보겠습니다.

확률 밀도 함수는 다음 형식의 공식으로 분석적으로 제공됩니다.

여기서 m X와 σ X는 분포 모수입니다. m X는 분포 중심의 위치를 ​​나타내며 σ X는 이 "중심"에 대한 분산입니다.

확률변수가 호출됩니다. 이산적, 가능한 모든 값의 집합이 유한 또는 무한하지만 반드시 셀 수 있는 값 집합을 나타내는 경우, 즉 모든 요소는 (적어도 이론적으로) 번호가 매겨지고 적절한 순서로 기록될 수 있습니다.

주사위를 던져 얻은 점수, 낮 동안 약국을 방문한 사람 수, 나무에 달린 사과 수 등 위에 나열된 확률변수는 이산확률변수입니다.

이산확률변수에 대한 가장 완전한 정보는 다음과 같이 제공됩니다. 유통법 이 값 - 이는 이 무작위 변수의 가능한 모든 값과 해당 확률 사이의 대응입니다.

이산 확률 변수의 분포 법칙은 종종 두 줄로 구성된 테이블 형식으로 지정되며, 첫 번째 줄에는 이 값의 가능한 모든 값(오름차순)이 나열되고 두 번째 줄에는 다음에 해당하는 확률이 나열됩니다. 다음 값:

엑스 x 1 x 2 xn
p 1 2페이지 р n

이산 확률 변수의 가능한 모든 값은 완전한 시스템을 나타내므로 확률의 합은 1과 같습니다( 정규화 조건):

예시 4.각각 12명, 10명, 8명, 10명, 9명, 12명, 8명, 11명, 10명, 9명의 학생으로 구성된 10개의 학생 그룹이 있습니다. 무작위로 선택된 그룹의 학생 수로 정의되는 무작위 변수 X에 대한 분포 법칙을 작성합니다.

해결책. 고려 중인 무작위 변수 X의 가능한 값(오름차순)은 8, 9, 10, 11, 12입니다. 무작위로 선택된 그룹에 8명의 학생이 있을 확률은 다음과 같습니다.

마찬가지로, 무작위 변수 X의 나머지 값에 대한 확률을 찾을 수 있습니다.

따라서 원하는 분배법칙은 다음과 같습니다.

엑스
0,2 0,2 0,3 0,1 0,2

이산 확률 변수의 분포 법칙은 이 변수의 가능한 각 값에 대해 해당 확률을 결정하는 공식(예: 베르누이 분포, 포아송 분포)을 사용하여 지정할 수도 있습니다. 이산 확률 변수의 특정 기능을 설명하기 위해 사용됩니다. 기본 수치 특성: 수학적 기대, 분산 및 표준 편차(표준).

수학적 기대 이산 확률 변수 x의 M(X)("μ" 표기법도 사용됨)는 가능한 모든 값과 해당 확률의 곱의 합입니다.

이산 확률 변수에 대한 수학적 기대의 주요 의미는 그것이 다음을 나타낸다는 것입니다. 평균값이 값의. 즉, 이산 확률 변수 X의 모든 관찰 값에 대한 산술 평균을 찾은 결과를 기반으로 특정 수의 테스트를 수행하면 이 산술 평균은 거의 동일합니다(정확할수록 더 많은 수량테스트) 주어진 무작위 변수의 수학적 기대에 대한 것입니다.

수학적 기대의 몇 가지 속성을 제시해 보겠습니다.

1. 상수 값의 수학적 기대값은 다음 상수 값과 같습니다.

M(S)=C

2. 이산 확률 변수에 의한 상수 인자의 곱의 수학적 기대는 이 확률 변수의 수학적 기대에 의한 상수 인자의 곱과 같습니다.

М(kX)=kM(X)

3. 두 확률 변수의 합에 대한 수학적 기대치는 다음 변수의 수학적 기대치의 합과 같습니다.

M(X+Y)=M(X)+M(Y)

4. 독립 확률 변수의 곱에 대한 수학적 기대치는 수학적 기대치의 곱과 같습니다.

M(X·Y)=M(X)·M(Y)

이산확률변수의 개별 값은 수학적 기대치를 중심으로 그룹화됩니다. 수학적 기대와 관련하여 이산 확률 변수의 가능한 값의 분산 정도를 특성화하기 위해 개념 이산확률변수의 분산.

변화이산 확률 변수 X의 D(X)("σ 2 " 표기법도 사용됨)는 수학적 기대값에서 이 값의 제곱 편차에 대한 수학적 기대값입니다.

D(X)=σ 2 =M((X - μ) 2),(11)

실제로는 다음 공식을 사용하여 분산을 계산하는 것이 더 편리합니다.

D(X)=σ 2 =M(X 2) - μ 2, (12)

분산의 주요 특성을 나열해 보겠습니다.

  1. 상수 값의 분산은 0입니다.
  1. 임의 변수의 분산은 음수가 아닌 숫자입니다.

D(X)≥0

  1. 이산 확률 변수에 의한 상수 인자 k의 곱의 분산은 이 확률 변수의 분산에 의한 이 상수 인자의 제곱의 곱과 같습니다.

D(kX)=k 2 ·D(X).

계산적 관점에서 볼 때 더 편리한 것은 분산이 아니라 확률 변수의 분산을 측정하는 또 다른 척도입니다. 엑스, 가장 자주 사용되는 - 표준 편차(표준 편차아니면 단순히 기준).

표준 편차이산 확률 변수의 분산의 제곱근은 다음과 같습니다.

표준편차의 편리성은 확률변수 자체의 차원을 갖는다는 것입니다. 엑스, 분산에는 차원의 제곱을 나타내는 차원이 있습니다. 엑스.

작업 종료 -

이 주제는 다음 섹션에 속합니다.

확률 이론의 요소

주제에 대한 과학적이고 방법론적인 입증.. 확률 이론은 그러한 연구에 나타나는 패턴을 연구합니다.. 많은 무작위 사건은 값을 취하는 무작위 변수에 의해 정량화될 수 있습니다.

이 주제에 대한 추가 자료가 필요하거나 원하는 내용을 찾지 못한 경우 당사 저작물 데이터베이스에서 검색을 사용하는 것이 좋습니다.

받은 자료로 무엇을 할 것인가:

이 자료가 도움이 되었다면 소셜 네트워크 페이지에 저장할 수 있습니다.

정의. 확률변수는 무작위 결과를 이용한 실험의 결과로 어떤 특정 기본 결과가 발생했는지에 따라 값이 달라지는 수치 값입니다. 확률변수가 가질 수 있는 모든 값의 집합을 이 확률변수의 가능한 값의 집합이라고 합니다.

무작위 변수는 다음을 의미합니다. 엑스, Y 1, 지 나는; ξ , 에타 1, μ 나는, 가능한 값은 다음과 같습니다. x 3, y 1k, z ij.

. 주사위를 한 번 던지는 실험에서 확률변수는 숫자이다. 엑스포인트가 떨어졌습니다. 무작위 변수의 가능한 값 세트 엑스처럼 보인다

{x 1 =1, x 2 =2, …, x 6 =6}.

기본 결과 사이에는 다음과 같은 대응 관계가 있습니다. ω 및 무작위 변수 값 엑스:

즉, 모든 기본 결과는 와이, 나는=1, …, 6, 숫자와 일치합니다. .

. 첫 번째 "문장"이 나타날 때까지 동전을 던집니다. 이 실험에서는 예를 들어 다음과 같은 확률 변수를 도입할 수 있습니다. 엑스- 가능한 많은 값을 가진 "문장"이 처음 나타날 때까지 던진 횟수( 1, 2, 3, … ) 그리고 와이- "문장"이 처음 나타나기 전에 그려진 "숫자"의 수(여러 가지 의미 포함) {0, 1, 2, …} (분명하다. X=Y+1). 본 실험에서는 기본 결과의 공간이 Ω 여러명으로 식별할 수 있다

{G, TsG, TsTsG, …, Ts…TsG, …},

그리고 기본 결과 ( TS...TSG)는 숫자와 일치합니다. m+1또는 , 어디 - 문자 "C"의 반복 횟수.

정의. 스칼라 함수 엑스(Ω)기본 결과의 공간에서 정의된 는 임의의 경우 무작위 변수라고 합니다. x∈R (Ω:X(Ω)< x} 이벤트입니다.

무작위 변수 분포 함수

확률 변수의 확률적 속성을 연구하려면 확률 변수가 해당 값의 하위 집합에서 값을 가져올 확률을 찾을 수 있는 규칙을 알아야 합니다. 그러한 규칙을 확률 분포의 법칙 또는 확률 변수의 분포라고 합니다.

모든 확률변수에 내재된 일반적인 분포법칙은 분포함수입니다.

정의. 확률변수의 분포함수(확률) 엑스함수를 호출 에프엑스(F(x)), 그 시점의 값 엑스사건의 확률과 같다 (엑스< x} 즉, 이러한 기본 결과만으로 구성된 이벤트입니다. ω , 이를 위해 엑스(Ω)< x :

F(x) = P(X< x} .

일반적으로 한 점에서의 분포함수의 값을 말한다. 엑스확률변수가 나올 확률과 같다. 엑스다음보다 작은 값을 취하게 됩니다. 엑스.

정리. 분포 함수는 다음 속성을 충족합니다.

분포 함수의 일반적인 형태.

이산확률변수

정의. 무작위 변수 엑스가능한 값의 집합이 유한하거나 셀 수 있는 경우 이산이라고 합니다.

정의. 이산확률변수의 분포(확률) 근처 엑스두 줄로 구성된 표입니다. 위쪽 줄에는 확률 변수의 가능한 모든 값이 나열되고 아래쪽 줄에는 확률이 나열됩니다. 파이 =P\(X=x i \)확률 변수가 이러한 값을 취하게 됩니다.

테이블의 정확성을 확인하려면 확률을 합산하는 것이 좋습니다. 피 나는. 정규화 공리 덕분에:

이산 확률 변수의 분포 계열을 사용하여 분포 함수를 구성할 수 있습니다. 에프엑스(F(x)). 허락하다 엑스- 분포 계열로 지정되며, x 1< x 2 < … < x n . 그럼 모두를 위해 x ≤ x 1이벤트 (엑스< x} 따라서 정의상 불가능합니다. F(x)=0. 만약에 x 1< x≤ x 2 , 그 다음에는 이벤트 (엑스< x} 다음과 같은 기본 결과로만 구성됩니다. 엑스(Ω)=x 1. 따라서, F(x)=p1. 마찬가지로, x 2< x ≤ x 3 이벤트 (엑스< x} 기본 결과로 구성됩니다. ω , 어느 쪽이든 엑스(Ω)=x 1, 또는 엑스(Ω)=x2, 그건 (엑스< x}={X=x 1 }+{X=x 2 } . 따라서, F(x)=p1+p2등. ~에 x > xn이벤트 (엑스< x} 그럼요, 그럼 F(x)=1.

이산확률변수의 분포 법칙은 공식이나 그래픽 형태로 분석적으로 지정될 수도 있습니다. 예를 들어, 주사위의 분포는 다음 공식으로 설명됩니다.

P(X=i) = 1/6, 나는=1, 2, …, 6.

일부 이산 확률 변수

이항 분포.이산확률변수 엑스 0, 1, 2, ...의 값을 취하면 이항법칙에 따라 분포됩니다. N Bernoulli의 공식에 의해 주어진 분포에 따라:

이 분포는 성공 횟수의 분포에 지나지 않습니다. 엑스 V N성공 확률이 있는 Bernoulli 방식을 사용한 테스트 그리고 실패 q=1-p.

포아송 분포.이산확률변수 엑스확률이 있는 음이 아닌 정수 값을 취하면 포아송의 법칙에 따라 분포됩니다.

어디 λ > 0 - 포아송 분포 매개변수.

푸아송 분포는 희소 사건의 법칙이라고도 합니다. 왜냐하면 많은 수의 시행이 수행되고 각각의 시행에서 "희귀" 사건이 발생할 가능성이 낮기 때문에 항상 나타나기 때문입니다.

예를 들어 포아송의 법칙에 따라 하루 동안 전화 교환소에서 받은 전화 수가 분배됩니다. 특정 지역에 떨어진 운석의 수; 물질의 방사성 붕괴 동안 붕괴된 입자의 수.

기하학적 분포.베르누이의 계획을 다시 살펴보자. 허락하다 엑스- 첫 번째 성공이 나타나기 전에 수행해야 하는 테스트 수입니다. 그 다음에 엑스- 0, 1, 2, ..., 값을 취하는 이산 확률 변수 N, ... 사건의 확률을 구해보자 (X=n).

  • X=0, 따라서 첫 번째 테스트에서 성공하면 P(X=0)=p.
  • X=1, 첫 번째 테스트에서 실패하고 두 번째 테스트에서 성공하면 P(X=1)=qp.
  • X=2, 처음 두 테스트에서 실패가 있고 세 번째 테스트에서 성공하면 피(X=2)=q2p.
  • 절차를 계속하면 P(X=i)=qip, 나는=0, 1, 2, …

      이러한 분포 계열을 갖는 확률 변수를 기하학적 법칙에 따라 분포라고 합니다.

무작위 변수

무작위 사건 및 확률과 함께 확률 이론에서 가장 중요한 개념 중 하나는 무작위 변수의 개념입니다.

정의.무작위 변수란 실험 결과에 따라 하나의 값 또는 다른 값을 가지며 어느 값인지 미리 알 수 없는 양을 의미합니다.

무작위 변수(약어 r.v.)는 라틴 대문자로 표시됩니다. X, Y, Z,... (또는 그리스 소문자 x (xi), h(eta), q (theta), y(psi) 등) 및 가능한 의미 - 해당 소문자 포함 엑스,~에,.

r.v.의 예 1) 100명의 신생아 중에서 태어난 남아의 수는 다음과 같은 가능한 값을 갖는 무작위 변수입니다: 0, 1, 2, ..., 100;

2) 총에서 발사될 때 발사체가 날아가는 거리는 무작위 변수입니다. 실제로 거리는 스코프의 설치뿐만 아니라 완전히 고려할 수 없는 다른 많은 이유(바람의 세기, 방향, 온도 등)에 따라 달라집니다. 이 수량의 가능한 값은 특정 간격에 속합니다( , ).

3) 엑스– 주사위를 던질 때 나타나는 포인트 수;

4) 와이– 목표물에 대한 첫 번째 명중까지의 발사 횟수;

5) – 장치 가동 시간 등 (사람의 키, 달러 환율, 배치 내 불량 부품 수, 기온, 플레이어의 승률, 에서 무작위로 선택된 지점의 좌표, 회사 이익 등).

첫 번째 예에서는 확률변수 엑스다음 가능한 값 중 하나를 사용할 수 있습니다: 0, 1, 2, . . ., 100. 이 값은 가능한 값이 없는 간격으로 서로 분리됩니다. 엑스. 따라서 이 예에서 확률 변수는 분리되고 고립된 가능한 값을 취합니다. 두 번째 예에서 확률 변수는 간격 값 중 하나를 취할 수 있습니다. , ). 여기서 가능한 확률 변수 값을 포함하지 않는 간격으로 하나의 가능한 값을 다른 값과 분리하는 것은 불가능합니다.

이미 말한 것에서 우리는 개별적이고 고립된 값만 취하는 확률변수와 가능한 값이 특정 구간을 완전히 채우는 확률변수를 구별하는 것이 바람직하다는 결론을 내릴 수 있습니다.

정의. 이산형(불연속)은 특정 확률로 개별적이고 셀 수 있는 가능한 값을 취하는 확률 변수(약칭 d.r.v.)입니다. 이산 확률 변수의 가능한 값의 수는 유한하거나 무한할 수 있습니다.

정의. r.v.의 가능한 값 집합이 셀 수 없는 경우 그러한 수량을 호출합니다. 마디 없는(약칭 n.s.v.) 연속 확률 변수는 유한 또는 무한 간격의 모든 값을 취할 수 있습니다. 분명히 연속 확률 변수의 가능한 값의 수는 무한합니다.



무작위 변수 엑스그리고 와이(예 3과 4)는 이산적입니다. S.v. (예 5)는 연속적입니다. 가능한 값은 간격에 속합니다. )