통계에서 평균을 결정하는 방법. 분포의 평균, 분산 및 모양 결정

평균 사이즈균질성의 일반화된 특성을 나타내는 통계적 지표라고 합니다.

평균 값은 전체 인구의 일반화 된 양적 특성을 제공하고 주어진 특성과 관련하여 특성화합니다.

예를 들어, 평균은 고려중인 근로자 인구의 임금 상태에 대한 일반화 된 양적 특성을 제공합니다. 또한 평균을 사용하면 다양한 정보 세트를 비교할 수 있습니다. 예를 들어 노동 생산성 수준, 수준 및 기타 지표를 기준으로 다양한 조직을 비교할 수 있습니다.

평균의 본질이는 특성 값의 무작위 편차를 제거하고 주요 요인으로 인한 변화를 고려한다는 사실에 있습니다.

평균값 방법에 의한 통계 처리는 다양한 특성의 개별 값을 균형 잡힌 평균값으로 대체하는 것으로 구성됩니다.

예를 들어, 5명의 창구원의 개별 출력 상업 은행하루에 136, 140, 154 및 162 작업이 이루어졌습니다. 한 운영자가 수행하는 일일 평균 거래 수를 얻으려면 이러한 개별 지표를 더하고 결과 금액을 운영자 수로 나누어야 합니다.

운영.

위의 예에서 볼 수 있듯이 단일 작업자가 150개의 작업을 수행하지 않았기 때문에 평균 작업 수는 개별 작업과 일치하지 않습니다. 그러나 각 연산자가 150개의 작업을 수행했다고 가정하면 총합은 변경되지 않고 750과 같습니다. 따라서 우리는 평균값의 주요 속성인 특성의 개별 값의 합에 도달했습니다. 평균값의 합과 같습니다.

이 속성은 평균값이 전체 통계 모집단의 일반화 특성임을 다시 한 번 강조합니다.

평균값은 다양한 지식 분야에서 널리 사용됩니다. 분석, 계획, 예측, 표준 계산 및 달성 수준 평가 등 경제 및 통계 분야에서 특히 중요한 역할을 합니다. 평균은 항상 명명된 수량이며 모집단의 개별 단위와 동일한 차원을 갖습니다.

올바른 계산과 평균 사용을 위한 가장 중요한 조건(원칙)은 다음과 같습니다.

  1. 각각의 특정 경우에, 연구 중인 특성과 계산에 사용할 수 있는 데이터의 관계를 고려하기 위해 평균화되는 특성의 질적 내용부터 진행해야 합니다.
  2. 평균이 계산되는 개별 값은 동질적인 모집단과 관련되어야 하며 그 수가 중요해야 합니다.

평균의 종류

평균값은 두 가지 큰 클래스로 나뉩니다. 권력 수단과 구조적 수단

전력 평균: 구조적 평균:

평균 형태의 선택은 평균 계산을 위한 초기 기준과 계산에 사용할 수 있는 경제적 정보에 따라 달라집니다.

평균값의 형태를 올바르게 선택하기 위한 계산의 초기 근거와 지침은 평균값의 의미와 지표 간의 관계를 표현하는 경제적 관계입니다.

일부 평균 계산:

  • 직원 1명의 평균 급여 = 급여 / 직원 수
  • 1개 제품의 평균가격 = 생산원가 / 생산단위수
  • 1개 제품의 평균원가 = 생산원가 / 생산단위수
  • 평균 수확량 = 총 수확량 / 파종 면적
  • 평균 노동 생산성 = 제품, 작업, 서비스의 양 / 근무 시간
  • 평균 노동 강도 = 근무 시간 / 제품, 작업, 서비스의 양
  • 평균 자본 집약도 = 고정 자산의 평균 비용 / 제품, 작업 및 서비스의 양
  • 평균 자본 생산성 = 제품, 작업 및 서비스의 양 / 평균 비용고정 자산
  • 평균 자본-노동 비율 = 고정 생산 자산의 평균 가치 / 평균 생산 인력 수
  • 평균 불량률 = (불량품 원가 / 생산된 전체 제품 원가) * 100%

전력 평균

소스 데이터의 표현에 따라 전력 평균은 다음과 같습니다. 단순하고 균형잡힌.
옵션이 한 번 발생하면 평균 단순(예: 근로자 한 명에게만 3,000루블의 급여가 발생함)을 기준으로 계산을 수행하고 옵션이 동일하지 않은 횟수로 반복되면 즉,

강의 5. 평균값

통계에서 평균의 개념

산술 평균과 그 속성

다른 유형의 전력 평균

모드와 중앙값

사분위수 및 십분위수

평균값은 통계에 널리 사용됩니다. 평균값의 특징 질적 지표 상업 활동: 유통비용, 이익, 수익성 등

평균- 이것은 일반적인 일반화 기술 중 하나입니다. 평균의 본질에 대한 올바른 이해는 평균이 개인과 무작위를 통해 경제 발전 패턴의 추세를 식별하기 위해 일반적이고 매우 중요한 것을 식별할 수 있게 해줄 때 시장 경제에서 그 특별한 중요성을 결정합니다.

평균값- 행동이 표현되는 일반적인 지표입니다. 일반 조건, 연구되는 현상의 패턴.

평균값 (통계에서) – 인구 단위당 사회 현상의 전형적인 규모나 수준을 나타내는 일반 지표로, 다른 모든 조건은 동일합니다.

평균 방법을 사용하면 다음 문제를 해결할 수 있습니다. 주요 목표:

1. 현상 발달 수준의 특징.

2. 둘 이상의 레벨을 비교합니다.

3. 사회 경제적 현상의 상호 관계에 대한 연구.

4. 우주에서의 사회 경제적 현상의 위치 분석.

통계 평균은 정확하게 통계적으로 구성된 질량 관찰(연속 및 선택적)의 질량 데이터를 기반으로 계산됩니다. 이 경우 통계 평균은 질적으로 균질한 인구(대량 현상)에 대한 대량 데이터로부터 계산된 경우 객관적이고 일반적입니다. 예를 들어, 협동조합과 국영 기업의 평균 임금을 계산하고 그 결과를 전체 인구로 확장하면 평균은 이질적인 인구에 대해 계산되고 이러한 평균은 모든 의미를 잃기 때문에 허구입니다.

평균의 도움으로 개별 관찰 단위에서 어떤 이유로 발생하는 특성 값의 차이가 완화됩니다. 예를 들어, 영업사원의 평균 생산량은 자격, 근무 기간, 연령, 서비스 형태, 건강 등 여러 가지 이유에 따라 달라집니다.

평균의 본질은 무작위 요인의 작용으로 인한 인구의 개별 단위 특성 값의 편차를 상쇄하고 기본 요인의 작용으로 인한 변화를 고려한다는 사실에 있습니다. 이를 통해 평균은 특성의 일반적인 수준을 반영하고 개별 단위에 내재된 개별 특성을 추상화할 수 있습니다.

평균값은 연구중인 특성의 값을 반영한 것이므로 주어진 특성과 동일한 차원에서 측정됩니다.

각 평균값은 하나의 특성에 따라 연구 대상 인구의 특성을 나타냅니다. 다양한 필수 특성에 따라 연구 대상 인구에 대한 완전하고 포괄적인 그림을 얻으려면 일반적으로 현상을 다양한 각도에서 설명할 수 있는 평균값 시스템을 갖는 것이 매우 중요합니다.

다양한 평균이 있습니다.

산술 평균;

기하평균;

조화 평균;

평균 제곱;

평균 연대순.

통계의 평균 개념 - 개념 및 유형. 2017, 2018년 "통계의 평균값 개념" 카테고리의 분류 및 특징.

경제 조사에 사용되는 가장 일반적인 형태의 통계 지표는 다음과 같습니다. 평균값 , 이는 특정 장소 및 시간 조건 하에서 통계적 모집단의 특성에 대한 일반화된 정량적 특성입니다.

평균값의 가장 중요한 속성 인구의 개별 단위의 속성 값은 무작위 요인을 포함한 여러 요인의 영향을 받아 한 방향 또는 다른 방향으로 변동하기 때문에 연구 대상 인구의 모든 단위에 공통된 것을 반영한다는 사실에 있습니다.

주자 경제 지표, 평균값 계산을 기반으로 그리고 그 본질을 공개합니다.

  • 기업 직원의 평균 급여 계산은 총 급여 기금을 직원 수로 나누어 수행됩니다.
  • 평균 크기은행 예금은 화폐 단위로 예금한 금액을 예금 건수로 나누어 구합니다.
  • 한 직원의 일일 평균 생산량을 결정하려면 해당 직원이 특정 기간 동안 수행한 작업량(부품 수)을 해당 기간의 일수로 나누어야 합니다.

통계에 사용되는 평균 유형

사회 경제적 및 분석적 문제를 해결하는 데 사용되는 주요 유형의 평균값을 고려해 보겠습니다.

단순 산술 평균 다음 공식으로 계산됩니다.

평균값을 계산할 때 평균화되는 특성의 개별 값이 여러 번 반복되거나 발생할 수 있습니다. 이러한 경우 그룹화된 데이터 또는 변형 계열을 사용하여 평균을 계산합니다. 가중 산술 평균 공식을 사용하는 예가 문제 2에 나와 있습니다.

평균 고조파 단순 다음 공식에 의해 결정됩니다.

조화수단은 분자에 대한 경제적 내용에 대한 정보가 있을 때 사용되지만 분모에 대해서는 사전에 결정되어야 합니다.

조화 평균 가중 다음 공식에 의해 결정됩니다.

이 공식은 속성 및 가중치 W의 개별 값이 여러 시간 간격으로 알려진 경우 정적으로뿐만 아니라 동적으로 평균 지표를 계산하는 데 사용됩니다. 가중 조화 평균 공식을 적용한 예는 문제 3에 나와 있습니다.

기하 평균 단순(가중치 없음) 다음 공식에 의해 결정됩니다.

이 유형의 평균은 평균 성장률을 결정하기 위해 역학 분석에 가장 널리 사용됩니다.

단순 평균 제곱(가중치 없음) 다음 공식에 의해 결정됩니다.

평균 제곱은 여러 요약 계산 지표 계산의 기초입니다.

경제 실무에서 가장 많이 사용되는 구조적 평균 모드와 중앙값입니다. 패션 (Mo)는 가장 높은 빈도로 반복되는 연구 대상 특성의 값을 나타냅니다. 중앙값 (Me)는 순위가 매겨진 모집단의 중간에 해당하는 속성의 값입니다. 이산 계열의 숫자에 대한 중앙값과 최빈값을 결정하는 예가 문제 1에 나와 있습니다.

중앙값의 주요 속성 중앙값과 속성 값의 절대 편차의 합이 다른 값보다 작다는 사실에 있습니다.

간격 계열의 경우 모드 계산 다음 공식에 따라 수행됩니다.

여기서 Ho는 모달 간격의 하한입니다(가장 높은 주파수를 갖는 간격을 모달이라고 함). i는 모달 간격의 값입니다. f Mo - 모달 간격의 빈도; f Mo-1 - 모달 이전 간격의 빈도; f Mo+1은 모달 1 이후 간격의 빈도입니다.

간격 계열의 경우 중앙값 계산 다음 공식에 따라 수행됩니다.

Ho - 중앙값 간격의 하한(중앙값은 누적 빈도가 총 빈도 합계의 절반을 초과하는 첫 번째 간격입니다) i는 중앙값 간격의 값입니다. Sme-1 - 중앙값 이전 간격의 누적 빈도입니다. f Me - 중앙값 간격의 빈도입니다.

"통계의 평균값"주제에 대한 문제 해결의 예

문제 1 . 일련의 숫자가 주어지면: 15; 15; 12; 14; 13. 이 계열의 범위, 산술 평균, 중앙값 및 최빈값을 구합니다.

해결책

1) 일련의 숫자의 범위는 이 숫자 중 가장 큰 숫자와 가장 작은 숫자의 차이입니다. 이 경우 범위는 R = 15-12 = 3입니다.

2) 간단한 산술평균 공식을 이용하여 주어진 계열의 산술평균을 구합니다. Хср = (15+15+12+14+13)/5=13.8

3) 중앙값을 결정하려면 제안된 계열을 정렬해야 합니다. 예를 들어 오름차순으로 숫자를 정렬합니다. 12; 13; 14; 15; 15.
이산 계열의 홀수 숫자의 중앙값은 가운데에 쓰여진 숫자입니다. 짝수 숫자의 중앙값은 가운데 있는 두 숫자의 산술 평균입니다.
우리의 경우 계열의 숫자 개수가 홀수이므로 Me = 14입니다.

4) 이산 숫자 계열의 모드는 특정 계열에서 다른 계열보다 더 자주 나타나는 숫자입니다. 숫자 15가 우리 계열에서 다른 계열보다 더 자주 나타나므로 Mo = 15입니다.

문제 2 . 도시 내 대학의 학생 수와 상업적으로 공부하는 학생의 비율(%)에 대한 정보가 있습니다.

1) 상업적 목적으로 공부하는 대학생의 평균 비율을 결정합니다. 2) 이 학생의 수.

해결책

이 문제를 해결하기 위해 제안된 테이블을 확장해 보겠습니다.

상업적으로 공부하는 대학생의 평균 비율은 가중 산술 평균 공식에 의해 결정됩니다: Хср = (15×15+3×10+7×20) / (15+3+7) = 15.8%.

답변 . 상업적 목적으로 공부하는 대학생의 평균 비율은 15.8%이며, 이 학생 수는 3,950명입니다.

문제 3 . 7월 1일 현재 미지급 대출채무 금액은 9,240만 화폐단위이다. 에 의해 개별 산업경제는 다음과 같이 배포되었습니다.

기한 내에 지불되지 않은 부채의 평균 비율을 결정하십시오. 매체 형태의 선택을 정당화하십시오.

해결책

기업마다 대출 부채 금액이 특정 가중치에 따라 다르기 때문에 가중 조화 평균 공식을 적용하겠습니다.
Хср = ΣW / Σ(W/х) = (32+14+46.4)/(32/20+14/28+46.4/16) = 92.4/5 = 18.48%.

답변 . 제때에 갚지 못한 부채의 평균 비율은 18.48%입니다.

통계 처리 단계에서는 다양한 연구 문제가 설정될 수 있으며, 이를 해결하려면 적절한 평균을 선택해야 합니다. 이 경우 다음 규칙을 따라야 합니다. 평균의 분자와 분모를 나타내는 양은 논리적으로 서로 관련되어야 합니다.

  • 전력 평균;
  • 구조적 평균.

다음 규칙을 소개하겠습니다.

평균이 계산되는 수량

평균. 위의 막대는 개별 값의 평균화가 발생함을 나타냅니다.

빈도(개별 특성 값의 반복성).

다양한 평균은 일반적인 전력 평균 공식에서 파생됩니다.

k = 1일 때 - 산술 평균; k = -1 - 조화 평균; k = 0 - 기하 평균; k = -2 - 제곱 평균 제곱근.

평균값은 단순하거나 가중될 수 있습니다.

가중 평균이는 속성 값의 일부 변형이 서로 다른 숫자를 가질 수 있으므로 각 옵션에 이 숫자를 곱해야 한다는 점을 고려한 값입니다. 즉, "척도"는 서로 다른 그룹의 집계 단위 수입니다. 각 옵션은 빈도에 따라 "가중치"가 적용됩니다. 빈도 f는 통계적 가중치 또는 평균 체중.

해당 거래는 5일(5건) 이내에 이루어진 것으로 알려졌으며, 판매율로 판매된 주식 수는 다음과 같이 분배되었습니다.

1 - 800ak. - 1010 문지름.

2 - 650ak. - 990 문지름.

3 - 700ak. - 1015 문지름.

4 - 550ak. - 900 문지름.

5 - 850ak. - 1150 문지름.

주식의 평균 가격을 결정하기 위한 초기 비율은 판매된 주식 수(KPA)에 대한 총 거래 금액(TVA)의 비율입니다.

OSS = 1010 800 + 990 650 + 1015 700+900 550+1150 850 = 3,634,500;

인민군 = 800+650+700+550+850=3550.

이 경우 평균 주가는 다음과 같습니다.

산술 평균의 속성을 알아야 하는데, 이는 사용과 계산 모두에 매우 중요합니다. 우리는 통계 및 경제 계산에서 산술 평균의 광범위한 사용을 결정하는 세 가지 주요 속성을 구별할 수 있습니다.

속성 1 (): 평균값에서 특성의 개별 값의 양수 편차의 합은 음수 편차의 합과 같습니다. 이는 임의적인 이유로 발생한 모든 편차(+ 및 - 모두)가 상호 상쇄된다는 점을 보여주기 때문에 매우 중요한 속성입니다.

증거:

속성 2 (최저한의): 산술 평균에서 특성의 개별 값의 제곱 편차의 합이 다른 숫자(a)보다 작습니다. 최소 숫자가 있습니다.

증거.

변수 a로부터의 제곱 편차의 합을 컴파일해 보겠습니다.

이 함수의 극값을 찾으려면 a에 대한 도함수를 0과 동일시해야 합니다.

여기에서 우리는 다음을 얻습니다:

결과적으로 편차 제곱합의 극값은 에서 달성됩니다. 함수는 최대값을 가질 수 없으므로 이 극값은 최소값입니다.

속성 3: 상수 값의 산술 평균은 다음 상수와 같습니다: for a = const.

이 세 가지 외에도 가장 중요한 속성산술 평균은 소위 디자인 속성, 전자 컴퓨터 기술의 사용으로 인해 점차 그 중요성을 잃어가고 있습니다.

  • 각 단위 속성의 개별 값을 상수로 곱하거나 나누면 산술 평균이 같은 양만큼 증가하거나 감소합니다.
  • 각 속성 값의 가중치(빈도)를 상수로 나누어도 산술 평균은 변하지 않습니다.
  • 각 단위 속성의 개별 값이 같은 양만큼 감소하거나 증가하면 산술 평균도 같은 양만큼 감소하거나 증가합니다.

고조파 평균. 이 평균은 k = -1일 때 사용되는 값이므로 역산술 평균이라고 합니다.

단순 조화 평균속성값의 가중치가 동일한 경우에 사용됩니다. 해당 공식은 k = -1을 대체하여 기본 공식에서 파생될 수 있습니다.

예를 들어, 동일한 경로를 주행했지만 속도가 다른 두 자동차의 평균 속도를 계산해야 합니다. 첫 번째 자동차는 100km/h, 두 번째 자동차는 90km/h입니다.

조화 평균 방법을 사용하여 평균 속도를 계산합니다.

통계적으로는 고조파 가중치가 더 자주 사용되며 그 공식은 다음과 같습니다.

이 공식은 각 속성의 가중치(또는 현상의 양)가 동일하지 않은 경우에 사용됩니다. 평균을 계산하기 위한 초기 관계에서 분자는 알지만 분모는 알 수 없습니다.

예를 들어, 평균 가격을 계산할 때 판매 수량에 대한 판매 금액의 비율을 사용해야 합니다. 우리는 판매된 단위 수를 알지 못하지만(다른 제품에 대해 이야기하고 있음) 이러한 다양한 제품의 판매량은 알고 있습니다.

판매된 상품의 평균 가격을 알아내야 한다고 가정해 보겠습니다.

우리는 얻는다

여기서 산술 평균 공식을 사용하면 비현실적인 평균 가격을 얻을 수 있습니다.

기하평균. 대부분의 경우 기하 평균은 특성의 개별 값이 상대 값의 형태로 표시될 때 평균 성장률(평균 성장 계수)을 결정하는 데 적용됩니다. 특성의 최소값과 최대값 사이의 평균을 구해야 하는 경우(예: 100에서 1000000 사이)에도 사용됩니다. 단순 및 가중 기하 평균에 대한 공식이 있습니다.

단순 기하 평균의 경우:

가중 기하 평균의 경우:

평균 제곱근 값. 주요 응용 분야는 전체 특성의 변화를 측정하는 것입니다(표준 편차 계산).

단순 평균 제곱 공식:

가중 평균 제곱 공식:

결과적으로 통계 연구 문제의 성공적인 해결은 각 특정 사례에서 평균값 유형을 올바르게 선택하는 데 달려 있다고 말할 수 있습니다.

평균을 선택하는 과정은 다음과 같습니다.

a) 인구에 대한 일반 지표를 설정합니다.

b) 주어진 일반 지표에 대한 수량의 수학적 관계 결정;

c) 개별 값을 평균값으로 대체합니다.

d) 적절한 방정식을 사용하여 평균을 계산합니다.

평균값은 다양한 특성을 지닌 수많은 개별 값을 기반으로 구축되므로 대중 사회 현상의 요약(최종) 특성을 제공하는 일반 통계 지표를 의미합니다. 평균값의 본질을 명확히하려면 평균값이 계산되는 데이터에 따라 해당 현상의 징후 값 형성의 특성을 고려해야합니다.

각 질량 현상의 단위는 수많은 특성을 가지고 있는 것으로 알려져 있습니다. 이러한 특성 중 어떤 특성을 취하든 그 값은 개별 단위마다 다르며, 통계에서 말하는 것처럼 단위마다 달라집니다. 예를 들어, 직원의 급여는 자격, 업무 성격, 근속 기간 및 기타 여러 요인에 따라 결정되므로 매우 넓은 범위 내에서 다릅니다. 모든 요인의 결합된 영향으로 각 직원의 소득이 결정되지만 경제의 다양한 부문에 종사하는 근로자의 평균 월급에 대해 이야기할 수 있습니다. 여기서는 대규모 인구 단위에 할당된 다양한 특성의 일반적인 특성 값을 사용하여 작업합니다.

평균값이 이를 반영합니다. 일반적인,이는 연구 대상 인구의 모든 단위에 일반적입니다. 동시에, 인구의 개별 단위의 특성 가치에 작용하는 모든 요소의 영향을 상호 소멸시키는 것처럼 균형을 맞춥니다. 모든 사회 현상의 수준(또는 규모)은 두 가지 요인 그룹의 작용에 의해 결정됩니다. 그 중 일부는 일반적이고 주요하며, 지속적으로 작동하고, 연구 중인 현상이나 과정의 본질과 밀접하게 관련되어 있으며, 전형적인연구 대상 인구의 모든 단위에 대해 평균값에 반영됩니다. 다른 사람들은 개인,그 효과는 덜 뚜렷하고 일시적이고 무작위적입니다. 그들은 반대 방향으로 작용하여 인구의 개별 단위의 양적 특성 사이에 차이를 일으키고 연구되는 특성의 일정한 값을 변경하려고 시도합니다. 개별 특성의 효과는 평균값에서 소멸됩니다. 일반적인 특성에서 균형을 이루고 상호 상쇄되는 전형적인 요소와 개별 요소의 결합된 영향에서 이는 다음과 같이 나타납니다. 일반적인 견해수학적 통계에서 알려진 기본 큰 수의 법칙.

집합적으로 특성의 개별 값은 공통된 질량으로 합쳐져 용해됩니다. 따라서 평균값이는 특성의 개별 가치와 정량적으로 일치하지 않고 벗어날 수 있는 "비인격적"으로 작용합니다. 평균값은 모든 원인의 공통 결과에 의해 결정되기 때문에 개별 단위의 특성 간의 무작위, 비정형 차이의 상호 취소로 인해 전체 인구의 일반, 특성 및 일반을 반영합니다.

그러나 평균값이 가장 일반적인 특성 값을 반영하려면 특정 모집단에 대해 결정해서는 안 되며 질적으로 동질적인 단위로 구성된 모집단에 대해서만 결정되어야 합니다. 이 요구 사항은 과학적 기반의 평균 사용을 위한 주요 조건이며 사회 경제적 현상 분석에서 평균 방법과 그룹화 방법 간의 긴밀한 연결을 의미합니다. 결과적으로 평균값은 특정 장소 및 시간 조건 하에서 동종 인구의 단위당 다양한 특성의 일반적인 수준을 나타내는 일반적인 지표입니다.

평균값의 본질을 정의함에 있어서, 평균값의 올바른 계산은 다음 요구 사항의 충족을 전제로 한다는 점을 강조할 필요가 있습니다.

  • 평균값이 계산되는 모집단의 질적 동질성. 이는 평균값 계산이 동질적이고 유사한 현상의 식별을 보장하는 그룹화 방법을 기반으로해야 함을 의미합니다.
  • 평균값 계산에 있어 무작위적이고 순전히 개별적인 원인 및 요인의 영향을 제외합니다. 이는 평균 계산이 대수의 법칙의 작용이 나타나고 모든 무작위성이 상쇄되는 충분히 방대한 자료를 기반으로 하는 경우에 달성됩니다.
  • 평균값을 계산할 때 계산 목적과 소위를 설정하는 것이 중요합니다. 지표 정의(속성)을 지향해야 합니다.

정의 지표는 평균화되는 특성 값의 합, 역값의 합, 값의 곱 등의 역할을 할 수 있습니다. 정의 지표와 평균 값 사이의 관계는 다음과 같이 표현됩니다. 평균화되는 특성의 모든 값이 평균값으로 대체되면 이 경우 해당 합계 또는 곱은 정의 지표를 변경하지 않습니다. 정의 지표와 평균값 간의 이러한 연결을 기반으로 평균값을 직접 계산하기 위한 초기 정량적 관계가 구축됩니다. 통계적 모집단의 속성을 보존하는 평균값의 능력을 호출합니다. 속성을 정의합니다.

인구 전체에 대해 계산된 평균값을 일반 평균;각 그룹에 대해 계산된 평균값 - 그룹 평균.일반 평균은 연구되는 현상의 일반적인 특징을 반영하고, 그룹 평균은 특정 그룹의 특정 조건에서 발생하는 현상의 특성을 제공합니다.

계산 방법은 다를 수 있으므로 통계에는 여러 유형의 평균이 있으며 주요 평균은 산술 평균, 조화 평균 및 기하 평균입니다.

안에 경제 분석평균값의 사용은 과학 기술 진보, 사회적 사건의 결과를 평가하고 경제 발전을 위한 매장량을 검색하는 주요 도구입니다. 동시에, 평균 지표에 과도하게 의존하면 경제 및 통계 분석을 수행할 때 편향된 결론을 초래할 수 있다는 점을 기억해야 합니다. 이는 일반적인 지표인 평균값이 실제로 존재하고 독립적인 관심을 가질 수 있는 인구의 개별 단위의 양적 특성의 차이를 소멸하고 무시한다는 사실 때문입니다.

평균의 종류

통계에서는 다양한 유형의 평균이 사용되며 이는 두 가지 큰 클래스로 나뉩니다.

  • 거듭제곱 평균(조화 평균, 기하 평균, 산술 평균, 2차 평균, 3차 평균);
  • 구조적 수단(모드, 중앙값).

계산하려면 전력 평균사용 가능한 모든 특성 값을 사용해야 합니다. 패션그리고 중앙값분포 구조에 의해서만 결정되므로 구조적 위치 평균이라고 합니다. 중앙값과 최빈값은 검정력 평균을 계산하는 것이 불가능하거나 비실용적인 모집단에서 평균 특성으로 자주 사용됩니다.

평균의 가장 일반적인 유형은 산술 평균입니다. 아래에 산술 평균특성의 모든 값의 총합이 인구의 모든 단위에 고르게 분포된 경우 인구의 각 단위가 갖게 될 특성의 값으로 이해됩니다. 이 값의 계산은 다양한 특성의 모든 값을 합산하고 결과 금액을 모집단의 총 단위 수로 나누는 것입니다. 예를 들어, 5명의 작업자가 부품 생산 주문을 이행했고, 첫 번째 작업자는 5개 부품, 두 번째는 7개, 세 번째는 4개, 네 번째는 10개, 다섯 번째는 12개를 생산했습니다. 소스 데이터에서 각 값은 옵션이 한 번만 발생한 경우, 한 작업자의 평균 생산량을 결정하려면 간단한 산술 평균 공식을 적용해야 합니다.

즉, 이 예에서 한 근로자의 평균 생산량은 다음과 같습니다.

단순 산술 평균과 함께 그들은 공부한다. 가중 산술 평균.예를 들어, 18세에서 22세 사이의 20명으로 구성된 그룹에서 학생의 평균 연령을 계산해 보겠습니다. xi- 평균화되는 특성의 변형, fi- 빈도는 발생 횟수를 나타냅니다. i번째집계된 값(표 5.1)

표 5.1

학생의 평균 연령

가중 산술 평균 공식을 적용하면 다음을 얻습니다.


가중 산술 평균을 선택하는 데는 특정 규칙이 있습니다. 두 지표에 일련의 데이터가 있고 그 중 하나에 대해 계산해야 하는 경우

평균값과 동시에 논리식의 분모의 수치가 알려져 있고 분자의 값은 알 수 없지만 이러한 지표의 곱으로 찾을 수 있으면 평균값은 산술 가중 평균 공식을 사용하여 계산됩니다.

어떤 경우에는 초기 통계 데이터의 특성상 산술 평균 계산이 의미를 잃고 유일한 일반화 지표는 다른 유형의 평균만 될 수 있습니다. 조화 평균.현재, 산술 평균의 계산 속성은 전자 컴퓨팅 기술의 광범위한 도입으로 인해 일반 통계 지표 계산에서 관련성을 잃었습니다. 단순하고 가중될 수도 있는 조화 평균값은 실용적으로 매우 중요해졌습니다. 논리식의 분자 수치가 알려져 있고 분모의 값은 알 수 없지만 한 지표를 다른 지표로 부분적으로 나누어 찾을 수 있는 경우 평균값은 고조파를 사용하여 계산됩니다. 가중 평균 공식.

예를 들어 자동차가 처음 210km를 70km/h의 속도로 주행했고 나머지 150km를 75km/h의 속도로 주행했다고 알려줍니다. 산술 평균 공식을 사용하여 360km의 전체 주행 동안 자동차의 평균 속도를 결정하는 것은 불가능합니다. 옵션은 개별 구간의 속도이기 때문에 xj= 70km/h 및 X2= 75km/h이고 가중치(fi)가 경로의 해당 구간으로 간주되면 옵션과 가중치의 곱은 물리적 또는 경제적 의미가 없습니다. 이 경우 몫은 경로 섹션을 해당 속도(옵션 xi), 즉 경로의 개별 섹션을 통과하는 데 소요된 시간(fi)으로 나누는 것에서 의미를 얻습니다. / xi). 경로의 구간을 fi로 표시하면 전체 경로는 Σfi로 표현되고, 전체 경로에 소요된 시간은 Σfi로 표현된다. / xi , 그런 다음 평균 속도는 전체 경로를 소요된 총 시간으로 나눈 몫으로 찾을 수 있습니다.

이 예에서는 다음을 얻습니다.

조화 평균을 사용할 때 모든 옵션의 가중치(f)가 동일하면 가중치가 적용된 옵션 대신 다음을 사용할 수 있습니다. 단순(비가중) 조화 평균:

여기서 xi는 개별 옵션입니다. N- 평균 특성의 변형 수. 속도 예에서 서로 다른 속도로 이동한 경로 세그먼트가 동일한 경우 단순 조화 평균이 적용될 수 있습니다.

모든 평균 값은 평균 특성의 각 변형을 대체할 때 평균 지표와 관련된 최종 일반 지표의 값이 변경되지 않도록 계산되어야 합니다. 따라서 경로의 개별 구간에 대한 실제 속도를 평균값(평균 속도)으로 대체할 때 총 거리는 변경되어서는 안 됩니다.

평균값의 형식(공식)은 이 최종 지표와 평균 지표의 관계 특성(메커니즘)에 따라 결정됩니다. 따라서 옵션을 평균값으로 대체할 때 값이 변경되어서는 안 되는 최종 지표는 다음과 같습니다. ~라고 불리는 지표를 정의합니다.평균에 대한 공식을 도출하려면 평균 지표와 결정 지표 간의 관계를 사용하여 방정식을 만들고 풀어야 합니다. 이 방정식은 평균화되는 특성(지표)의 변형을 평균값으로 대체하여 구성됩니다.

통계에서는 산술 평균과 조화 평균 외에도 다른 유형(형태)의 평균이 사용됩니다. 모두 특수한 경우입니다 전력 평균.동일한 데이터에 대해 모든 유형의 전력 평균을 계산하면 값은 다음과 같습니다.

그들은 같은 것으로 판명될 것입니다. 여기에 규칙이 적용됩니다 주요 비율평균. 평균의 지수가 증가하면 평균값 자체도 증가합니다. 실제 연구에서 가장 많이 사용되는 계산식 다양한 방식전력 평균값은 표에 나와 있습니다. 5.2.

표 5.2


기하평균은 다음과 같은 경우에 사용됩니다. N성장 계수, 특성의 개별 값은 일반적으로 역학 시리즈의 각 수준의 이전 수준에 대한 비율로 체인 값의 형태로 구성된 상대 역학 값입니다. 따라서 평균은 평균 성장률을 나타냅니다. 평균 기하학적 단순공식으로 계산

공식 가중 기하 평균다음과 같은 형식을 갖습니다:

위의 공식은 동일하지만 하나는 현재 계수 또는 성장률에 적용되고 두 번째는 계열 수준의 절대 값에 적용됩니다.

평균 제곱분포 계열의 산술 평균 주변 특성의 개별 값의 변동 정도를 측정하는 데 사용되며 다음 공식으로 계산됩니다.

가중 평균 제곱다른 공식을 사용하여 계산:

평균 입방체 3차 함수의 값으로 계산할 때 사용되며 다음 공식으로 계산됩니다.

평균 입방체 가중:

위에서 논의한 모든 평균값은 일반 공식으로 표현될 수 있습니다.

평균값은 어디에 있습니까? - 개별적인 의미 N- 연구 대상 인구의 단위 수; 케이- 평균 유형을 결정하는 지수입니다.

동일한 소스 데이터를 사용하는 경우, 케이 V 일반 공식전력 평균, 평균 값이 커집니다. 이에 따라 전력 평균 값 사이에는 자연스러운 관계가 있습니다.

위에 설명된 평균값은 연구 대상 인구에 대한 일반화된 아이디어를 제공하며, 이러한 관점에서 이들의 이론적, 적용적, 교육적 중요성은 논쟁의 여지가 없습니다. 그러나 평균값이 실제로 존재하는 옵션과 일치하지 않는 경우가 있으므로 고려된 평균 외에도 통계 분석에서 매우 구체적인 위치를 차지하는 특정 옵션의 값을 사용하는 것이 좋습니다. 순서가 지정된(순위가 지정된) 일련의 속성 값입니다. 이들 수량 중 가장 일반적으로 사용되는 수량은 다음과 같습니다. 구조적,또는 설명적, 평균적- 모드(Mo) 및 중앙값(Me).

패션- 특정 모집단에서 가장 자주 발견되는 특성의 값입니다. 변주 계열과 관련하여 모드는 순위 계열 중 가장 자주 발생하는 값, 즉 빈도가 가장 높은 옵션입니다. 패션은 더 자주 방문하는 매장, 즉 모든 제품의 가장 일반적인 가격을 결정하는 데 사용될 수 있습니다. 인구의 상당 부분의 특징적인 크기를 보여 주며 공식에 의해 결정됩니다.

여기서 x0은 간격의 하한입니다. 시간- 간격 크기; FM- 간격 빈도; fm_ 1 - 이전 간격의 빈도. FM+ 1 - 다음 간격의 빈도.

중앙값순위 행 중앙에 위치한 옵션이 호출됩니다. 중앙값은 계열을 양쪽에 동일한 수의 인구 단위가 있도록 하는 방식으로 계열을 두 개의 동일한 부분으로 나눕니다. 이 경우 모집단 단위의 절반은 중앙값보다 작은 가변 특성 값을 갖고 나머지 절반은 이보다 큰 값을 갖습니다. 중앙값은 값이 분포 계열 요소의 절반보다 크거나 같거나 동시에 작거나 같은 요소를 연구할 때 사용됩니다. 중앙값은 속성 값이 어디에 집중되어 있는지, 즉 그 중심이 어디에 있는지에 대한 일반적인 아이디어를 제공합니다.

중앙값의 설명적 성격은 인구 단위의 절반이 소유한 다양한 특성 값의 양적 한계를 특징으로 한다는 사실에서 나타납니다. 이산형 변동 계열의 중앙값을 찾는 문제는 쉽게 해결됩니다. 시리즈의 모든 단위에 일련 번호가 부여된 경우 중간 옵션의 일련 번호는 n의 홀수 구성원을 사용하여 (n + 1) / 2로 결정됩니다. 시리즈의 구성원 수가 짝수인 경우 , 중앙값은 일련번호가 있는 두 옵션의 평균값이 됩니다. N/ 2 그리고 N / 2 + 1.

등간변동 계열의 중앙값을 결정할 때에는 먼저 그것이 위치한 간격(중앙값 간격)을 결정한다. 이 간격은 주파수의 누적 합이 계열의 모든 주파수 합의 절반과 같거나 초과한다는 사실이 특징입니다. 간격 변동 계열의 중앙값은 다음 공식을 사용하여 계산됩니다.

어디 X0- 간격의 하한 시간- 간격 크기; FM- 간격 빈도; 에프- 시리즈 회원 수

∫m-1은 주어진 것보다 앞선 계열의 누적 항의 합입니다.

더 많은 경우 중앙값과 함께 전체 특성연구 대상 인구의 구조는 또한 순위가 매겨진 시리즈에서 매우 특정한 위치를 차지하는 다른 옵션 값을 사용합니다. 여기에는 다음이 포함됩니다 사분위수그리고 십분위.사분위수는 빈도의 합에 따라 계열을 4개의 동일한 부분으로 나누고, 십분위수는 10개의 동일한 부분으로 나눕니다. 3분위수와 9분위수가 있습니다.

중앙값과 모드는 산술 평균과 달리 변수 특성 값의 개인차를 제거하지 않으므로 통계 모집단의 추가적이고 매우 중요한 특성입니다. 실제로는 평균 대신 또는 평균과 함께 사용되는 경우가 많습니다. 연구 중인 모집단에 다양한 특성 값이 매우 크거나 매우 작은 특정 수의 단위가 포함되어 있는 경우 중앙값과 모드를 계산하는 것이 특히 좋습니다. 인구의 특징이 아닌 옵션의 이러한 값은 산술 평균의 값에 영향을 주지만 중앙값 및 모드의 값에는 영향을 미치지 않으므로 후자가 경제 및 통계에 매우 귀중한 지표가 됩니다. 분석.

변형 표시기

통계 연구의 목적은 연구 대상인 통계 모집단의 기본 특성과 패턴을 확인하는 것입니다. 통계적인 관측자료를 요약처리하는 과정에서 유통 시리즈.분포 계열에는 그룹화의 기초로 사용되는 특성이 정성적인지 정량적인지 여부에 따라 귀속형과 변이형의 두 가지 유형이 있습니다.

변형정량적으로 구성된 분포 계열이라고 합니다. 인구의 개별 단위의 정량적 특성 값은 일정하지 않으며 서로 다소 다릅니다. 이러한 특성 값의 차이를 이라고 합니다. 변형.연구 대상 모집단에서 발견된 특성의 개별 수치를 호출합니다. 가치의 변형.인구의 개별 단위에 변화가 존재하는 것은 특성 수준의 형성에 많은 요인이 영향을 미치기 때문입니다. 인구의 개별 단위의 특성 변화의 성격과 정도에 대한 연구는 다음과 같습니다. 가장 중요한 문제모든 통계 연구. 변이 지수는 특성 변이의 척도를 설명하는 데 사용됩니다.

통계 연구의 또 다른 중요한 임무는 인구의 특정 특성의 변화에서 개별 요인 또는 해당 그룹의 역할을 결정하는 것입니다. 이 문제를 해결하기 위해 통계에서는 변동을 측정하는 지표 시스템을 사용하여 변동을 연구하는 특별한 방법을 사용합니다. 실제로 연구원은 많은 문제에 직면합니다. 큰 금액집합에서 속성 값에 따른 단위 분포에 대한 아이디어를 제공하지 않는 속성 값의 변형입니다. 이렇게 하려면 특성 값의 모든 변형을 오름차순 또는 내림차순으로 정렬합니다. 이 과정을 시리즈 순위.순위가 매겨진 계열은 해당 특성이 집합적으로 취하는 값에 대한 일반적인 아이디어를 즉시 제공합니다.

모집단을 철저하게 설명하기 위한 평균값이 부족하기 때문에 연구 중인 특성의 변동성(변이)을 측정하여 이러한 평균의 대표성을 평가할 수 있는 지표로 평균값을 보완해야 합니다. 이러한 변동 지표를 사용하면 통계 분석을 더욱 완전하고 의미있게 만들 수 있으며 이를 통해 연구 중인 사회 현상의 본질에 대한 더 깊은 이해를 얻을 수 있습니다.

변이의 가장 단순한 징후는 다음과 같습니다. 최저한의그리고 최대 -이게 가장 작고 가장 높은 가치집합적으로 표시됩니다. 특성 값의 개별 변형의 반복 횟수를 호출합니다. 반복 빈도.속성 값의 반복 빈도를 나타냅니다. 안녕,연구 대상 인구의 양과 동일한 빈도의 합은 다음과 같습니다.

어디 케이- 속성 값에 대한 옵션 수. 주파수를 주파수로 바꾸는 것이 편리합니다. 위. 빈도- 상대 빈도 표시기 - 단위 또는 백분율의 분수로 표시할 수 있으며 다양한 관찰 횟수를 사용하여 변형 계열을 비교할 수 있습니다. 공식적으로는 다음과 같습니다.

다양한 절대값과 상대 지표. 절대 변동 지표에는 평균 선형 편차, 변동 범위, 분산 및 표준 편차가 포함됩니다.

변화의 범위(R)은 연구 대상 모집단에서 해당 속성의 최대값과 최소값 간의 차이를 나타냅니다. 아르 자형= X최대 - X최소. 이 지표는 옵션의 최대값 간의 차이만 보여주기 때문에 연구 중인 특성의 가변성에 대한 가장 일반적인 아이디어만 제공합니다. 이는 변이 계열의 주파수, 즉 분포의 특성과 전혀 관련이 없으며 그 의존성은 특성의 극단 값에만 불안정하고 무작위적인 특성을 부여할 수 있습니다. 변동 범위는 연구 대상 모집단의 특성에 대한 정보를 제공하지 않으며 얻은 평균값의 전형성 정도를 평가할 수 없습니다. 이 지표의 적용 범위는 상당히 동질적인 모집단으로 제한되며, 보다 정확하게는 특성의 모든 값의 변동성을 고려한 지표인 특성의 변동을 특성화합니다.

특성의 변화를 특성화하려면 연구 대상 모집단의 일반적인 값과 모든 값의 편차를 일반화해야 합니다. 그러한 지표

평균 선형 편차, 분산 및 표준 편차와 같은 변동은 산술 평균에서 모집단의 개별 단위 특성 값의 편차를 고려하여 결정됩니다.

평균 선형 편차산술 평균에서 개별 옵션의 편차 절대값의 산술 평균을 나타냅니다.


산술 평균에서 변형 편차의 절대값(계수)입니다. 에프-빈도.

첫 번째 수식은 각 옵션이 집합에서 한 번만 발생하고 두 번째 수식은 동일하지 않은 빈도로 연속적으로 발생하는 경우 적용됩니다.

산술 평균에서 옵션의 편차를 평균하는 또 다른 방법이 있습니다. 통계에서 매우 일반적인 이 방법은 후속 평균을 통해 평균 값에서 옵션의 제곱 편차를 계산하는 것입니다. 이 경우, 우리는 분산이라는 새로운 변화 지표를 얻습니다.

분산(σ 2) - 평균 값에서 속성 값 옵션의 제곱 편차의 평균:

옵션에 고유한 가중치(또는 변형 시리즈의 빈도)가 있는 경우 두 번째 공식이 적용됩니다.

경제 및 통계 분석에서는 표준 편차를 사용하여 특성의 변화를 평가하는 것이 일반적입니다. 표준 편차(σ)는 분산의 제곱근입니다.

평균 선형 및 표준 편차는 연구 중인 모집단 단위 사이에서 특성 값이 평균적으로 얼마나 변동하는지를 보여 주며 옵션과 동일한 측정 단위로 표현됩니다.

통계 실무에서는 변동을 비교해야 하는 경우가 종종 있습니다. 다양한 표지판. 예를 들어 직원의 연령과 자격, 근속 기간 및 임금 등의 변화를 비교하는 것은 매우 흥미롭습니다. 이러한 비교를 위해 특성의 절대 변동성 지표(선형 평균 및 표준 편차)는 적합하지 않습니다. 실제로 연수로 표시되는 근속 기간의 변동과 루블 및 코펙으로 표시되는 임금 변동을 비교하는 것은 불가능합니다.

다양한 특성의 변동성을 함께 비교할 때는 상대적인 변동 측정값을 사용하는 것이 편리합니다. 이러한 지표는 산술 평균(또는 중앙값)에 대한 절대 지표의 비율로 계산됩니다. 변동 범위, 평균 선형 편차 및 표준 편차를 절대 변동 지표로 사용하여 상대적 변동 지표를 얻습니다.


모집단의 동질성을 특징짓는 상대적 변동성의 가장 일반적으로 사용되는 지표입니다. 정규 분포에 가까운 분포에 대해 변동 계수가 33%를 초과하지 않으면 모집단은 동질적인 것으로 간주됩니다.