Cum se determină valoarea medie în statistici. Determinarea mediei, variației și formei distribuției

Valoarea medie numit indicator statistic care dă o caracteristică generalizată de omogen.

Valoarea mediei dă o caracteristică cantitativă generalizantă a întregii populaţii şi o caracterizează în raport cu această trăsătură.

Deci, de exemplu, media dă o caracteristică cantitativă generalizantă a stării de remunerare a setului considerat de lucrători. În plus, folosind medii, este posibilă compararea diferitelor seturi de informații. Deci, de exemplu, puteți compara diferite organizații în ceea ce privește productivitatea muncii, precum și în ceea ce privește , și în alți indicatori.

Esența mijlocului constă în faptul că abaterile aleatorii ale valorilor caracteristice sunt anulate în acesta și se iau în considerare modificările cauzate de factorul principal.

Prelucrarea statistică prin metoda mediilor constă în înlocuirea valorilor individuale ale unui atribut variabil cu o valoare medie echilibrată.

De exemplu, ieșire individuală pentru 5 casieri Banca Comerciala pe zi a fost de 136, 140, 154 și 162 de operații. Pentru a obține numărul mediu de tranzacții pe zi efectuate de un singur casier, trebuie să adăugați acești indicatori individuali și să împărțiți suma rezultată la numărul de casier:

Operațiuni.

După cum se poate observa din exemplul de mai sus, numărul mediu de tranzacții nu se potrivește cu niciuna dintre cele individuale, deoarece niciun operator nu a făcut 150 de tranzacții. Dar dacă ne imaginăm că fiecare operator a efectuat 150 de operații, atunci valoarea lor totală nu se va modifica, ci va fi, de asemenea, egală cu 750. Astfel, am ajuns la principala proprietate a valorilor medii: suma valorilor individuale ale atributul este egal cu suma valorilor medii.

Această proprietate subliniază încă o dată că valoarea medie este o caracteristică generalizantă a întregii populații statistice.

Valorile medii sunt utilizate pe scară largă în diferite ramuri ale cunoașterii. Ele joacă un rol deosebit de important în economie și statistică: în analiză, planificare, prognoză, în calculul standardelor și în evaluarea nivelului atins. Media este întotdeauna o valoare numită și are aceeași dimensiune ca o unitate separată a populației.

Cele mai importante condiții (principii) pentru calcularea și utilizarea corectă a mediilor sunt următoarele:

  1. În fiecare caz specific, este necesar să se pornească de la conținutul calitativ al caracteristicii medii, să se ia în considerare relația dintre caracteristicile studiate și datele disponibile pentru calcul.
  2. Valorile individuale din care se calculează mediile trebuie să aparțină unei populații omogene, iar numărul acestora trebuie să fie semnificativ.

Tipuri de medii

Valorile medii sunt împărțite în două clase mari: mijloace de putere și mijloace de structură

Medii de putere: Medii structurale:

Alegerea formei mediei depinde de baza inițială de calcul a mediei și de informațiile economice disponibile pentru calcularea acesteia.

Baza inițială pentru calcul și punctul de referință pentru alegerea corectă a formei valorii medii sunt relațiile economice care exprimă semnificația valorilor medii și relația dintre indicatori.

Calculul unor valori medii:

  • Salariu mediu 1 angajat = Salarizare / Numar de angajati
  • Prețul mediu al unui produs = Costul de producție / Numărul de unități de producție
  • Costul mediu al unui produs = Costul de producție / Numărul de unități de producție
  • Randament mediu = Recoltă brută / suprafață însămânțată
  • Productivitatea medie a muncii \u003d volumul de produse, lucrări, servicii / ore lucrate
  • Intensitatea medie a muncii \u003d ore lucrate/volum de produse, lucrări, servicii
  • Intensitatea medie a capitalului \u003d Costul mediu al activelor fixe / volumul produselor, lucrărilor și serviciilor
  • Rentabilitatea medie a activelor \u003d volumul produselor, lucrărilor și serviciilor / cost mediu mijloace fixe
  • Raportul mediu capital-muncă \u003d valoarea medie a activelor fixe de producție / numărul mediu de personal de producție
  • Rata medie de respingere = (costul produselor defecte / Costul tuturor produselor fabricate) * 100%

Mediile de putere

Mediile de putere, în funcție de prezentarea datelor inițiale, pot fi simplu si echilibrat.
Dacă varianta apare o dată, calculele sunt efectuate conform mediei simple (de exemplu, un salariu de 3 mii de ruble se găsește doar la un lucrător), iar dacă varianta se repetă de un număr inegal de ori, adică are diferit

Cursul 5

Conceptul de medie în statistică

Media aritmetică și proprietățile sale

Alte tipuri de mijloace de putere

Mod și mediană

Quartile și decile

Valorile medii sunt utilizate pe scară largă în statistici. Valorile medii caracterizează indicatori calitativi activitati comerciale: costuri de distributie, profit, profitabilitate etc.

Mediu Aceasta este una dintre cele mai comune generalizări. O înțelegere corectă a esenței mediei determină semnificația ei deosebită într-o economie de piață, când media, printr-o singură și aleatorie, face posibilă identificarea e generală și extrem de importantă, identificarea tendinței modelelor de dezvoltare economică. .

valoarea medie- sunt indicatori generalizatori în care găsesc expresie a acţiunii condiţiilor generale, tipare ale fenomenului studiat.

valoarea medie (în statistică) - un indicator generalizator care caracterizează dimensiunea sau nivelul tipic al fenomenelor sociale pe unitatea de populație, toate celelalte lucruri fiind egale.

Metoda mediilor rezolvă următoarele scopuri principale:

1. Caracteristici ale nivelului de dezvoltare a fenomenelor.

2. Compararea a două sau mai multe niveluri.

3. Studiul relaţiei fenomenelor socio-economice.

4. Analiza distribuţiei fenomenelor socio-economice în spaţiu.

Mediile statistice se calculează pe baza datelor de masă ale observației de masă organizate corect statistic (continuă și selectivă). În același timp, media statistică va fi obiectivă și tipică dacă este calculată din date de masă pentru o populație omogenă calitativ (fenomene de masă). De exemplu, dacă calculăm salariile medii în cooperative și întreprinderile de stat și extindem rezultatul la întreaga populație, atunci media este fictivă, deoarece este calculată pentru o populație eterogenă, iar o astfel de medie își pierde orice semnificație.

Cu ajutorul mediei, există, parcă, o netezire a diferențelor de valoare a atributului care apar dintr-un motiv sau altul în unitățile individuale de observație. De exemplu, producția medie a unui agent de vânzări depinde de mulți factori: calificări, vechime în serviciu, vârstă, formă de serviciu, sănătate etc.

Esența mediei constă în faptul că anulează abaterile valorilor atributului unităților individuale ale populației, datorită acțiunii factorilor aleatori, și ia în considerare modificările cauzate de acțiunea de bază. factori. Acest lucru permite ca media să reflecte nivelul tipic al atributului și să facă abstracție de la caracteristicile individuale inerente unităților individuale.

Valoarea medie este o reflectare a valorilor trăsăturii studiate, prin urmare, este măsurată în aceeași dimensiune cu trăsătura dată.

Fiecare valoare medie caracterizează populația studiată în funcție de orice atribut. Pentru a obține o imagine completă și cuprinzătoare a populației studiate în ceea ce privește o serie de caracteristici esențiale, este în general extrem de important să existe un sistem de valori medii care să poată descrie fenomenul din diferite unghiuri.

Există diferite medii:

Media aritmetică;

medie geometrică;

Armonică medie;

Medie pătrată;

Cronologic mediu.

Conceptul de valoare medie în statistică - conceptul și tipurile. Clasificarea și caracteristicile categoriei „Conceptul valorii medii în statistică” 2017, 2018.

Cea mai comună formă de indicatori statistici utilizată în cercetarea economică este valoarea medie , care este o caracteristică cantitativă generalizată a unei trăsături dintr-o populație statistică în condiții specifice de loc și timp.

Cea mai importantă proprietate a valorii medii constă în faptul că reflectă lucrul comun care este inerent tuturor unităților populației studiate, deoarece valorile atributului unităților individuale ale populației fluctuează într-o direcție sau alta sub influența multor factori, printre care pot fi aleatorii.

Să aducem exemple indicatori economici, pe baza calculului valorii medii și dezvăluind esența sa:

  • calculul salariului mediu al angajaților întreprinderii se realizează prin împărțirea fondului total de salarii la numărul de angajați;
  • mărimea medie a unui depozit la o bancă se află prin împărțirea sumei depozitelor în termeni monetari la numărul de depozite;
  • pentru a determina producția zilnică medie a unui angajat, este necesar să se împartă cantitatea de muncă (numărul de părți) efectuată de angajat într-o anumită perioadă la numărul de zile din această perioadă.

Tipuri de medii utilizate în statistici

Luați în considerare principalele tipuri de medii utilizate în rezolvarea problemelor socio-economice și analitice.

medie aritmetică simplă calculat prin formula:

La calcularea valorilor medii, valorile individuale ale caracteristicii medii pot fi repetate, apar de mai multe ori. În astfel de cazuri, calculul mediei se face pe baza datelor grupate sau a seriilor variaționale. Un exemplu de aplicare a formulei mediei aritmetice ponderate este prezentat în problema 2.

Armonică medie simplă este determinată de formula:

Mediile armonice se folosesc atunci când există informații pentru numărător asupra conținutului economic, iar pentru numitor trebuie mai întâi determinate.

Armonică medie ponderată este determinată de formula:

Această formulă este utilizată pentru a calcula medii nu numai în statică, ci și în dinamică, atunci când valorile individuale ale trăsăturii și greutății W sunt cunoscute pentru un număr de intervale de timp. Un exemplu de aplicare a formulei mediei armonice ponderate este prezentat în problema 3.

Media geometrică simplă (neponderată) determinat de formula:

Acest tip de medie este utilizat pe scară largă în analiza dinamicii pentru a determina rata medie de creștere.

Rădăcină medie pătrată simplă (neponderată) determinat de formula:

Pătratul mediu stă la baza calculelor unui număr de indicatori calculați sumar.

Cel mai des folosit în practica economică medii structurale sunt modul și mediana. Modă (Mo) reprezintă valoarea caracteristicii studiate, repetată cu cea mai mare frecvență. Median (Me) este valoarea caracteristicii care se încadrează în mijlocul populației clasate (ordonate). Un exemplu de determinare a mediei și a modului pentru o serie discretă de numere este prezentat în problema 1.

Proprietatea principală a medianei constă în faptul că suma abaterilor absolute ale valorilor trăsăturilor de la mediană este mai mică decât de la orice altă valoare.

Pentru o serie de intervale, calculul modului se efectuează după formula:

unde Xo este limita inferioară a intervalului modal (intervalul cu cea mai mare frecvență se numește modal); i - valoarea intervalului modal; f Mo este frecvența intervalului modal; f Mo-1 - frecvența intervalului premergător modalului; f Mo+1 - frecvența intervalului care urmează modalului.

Pentru o serie de intervale, calculul medianei se efectuează după formula:

Ho - limita inferioară a intervalului median (mediana este primul interval, a cărui frecvență acumulată depășește jumătate din suma totală de frecvențe); i - valoarea intervalului median; Sme-1 - frecvența acumulată a intervalului care precede mediana; f Me - frecvența intervalului median.

Exemple de rezolvare a problemelor pe tema „Valorile medii în statistică”

Sarcina 1 . Dată o serie de numere: 15; 15; 12; paisprezece; 13. Aflați intervalul, media aritmetică, mediana și modul acestei serii.

Decizie

1) Intervalul unei serii de numere este diferența dintre cel mai mare și cel mai mic dintre aceste numere. În acest caz, intervalul este R = 15-12 = 3

2) Media aritmetică a acestei serii se găsește prin formula mediei aritmetice simplă. Xav = (15+15+12+14+13)/5=13,8

3) Pentru a determina mediana, este necesar să sortați seria propusă - aranjați numerele, de exemplu, în ordine crescătoare: 12; 13; paisprezece; 15; 15.
Mediana unui număr impar de numere dintr-o serie discretă este numărul scris în mijloc. Mediana unui număr par de numere este media aritmetică a celor două numere din mijloc.
Deoarece în cazul nostru numărul de numere din serie este impar, atunci Me = 14.

4) Modul unei serii discrete de numere este numărul care apare în această serie mai des decât altele. Deoarece numărul 15 se găsește în seria noastră mai des decât altele, Mo = 15.

Sarcina 2 . Există informații despre numărul de studenți ai universităților orașului și proporția (%) de studenți care studiază pe bază comercială:

Determinați: 1) proporția medie a studenților universitari care studiază pe bază comercială; 2) numărul acestor elevi.

Decizie

Pentru a rezolva acest lucru, să extindem tabelul propus:

Proporția medie a studenților universitari care studiază pe bază comercială este determinată de formula mediei aritmetice ponderate: Хav = (15×15+3×10+7×20) / (15+3+7) = 15,8%.

Răspuns . Proporția medie a studenților universitari care studiază pe bază comercială este de 15,8%, numărul acestor studenți fiind de 3.950 de persoane.

Sarcina 3 . La 1 iulie, valoarea creditelor neachitate la termen se ridica la 92,4 milioane unități monetare. De industrii individuale economie, a fost repartizat astfel:

Determinați procentul mediu al datoriei neplătite la timp. Justificați alegerea formei de mijloc.

Decizie

Deoarece la diferite întreprinderi, valoarea datoriei aferente împrumuturilor este diferită pentru diferite ponderi specifice, aplicăm formula medie ponderată armonică.
Xav = ΣW / Σ(W/х) = (32+14+46,4)/(32/20+14/28+46,4/16) = 92,4/5 = 18,48%.

Răspuns . Procentul mediu al datoriei neachitate la timp este de 18,48%.

În etapa prelucrării statistice, pot fi stabilite o varietate de sarcini de cercetare, pentru a căror soluție este necesară alegerea mediei adecvate. În acest caz, este necesar să vă ghidați după următoarea regulă: valorile care reprezintă numărătorul și numitorul mediei trebuie să fie legate logic între ele.

  • medii de putere;
  • medii structurale.

Să introducem următoarea notație:

Valorile pentru care se calculează media;

Medie, unde linia de mai sus indică faptul că are loc media valorilor individuale;

Frecvență (repetabilitate a valorilor trăsăturilor individuale).

Din formula generală a mediei puterii sunt derivate diferite mijloace:

pentru k = 1 - medie aritmetică; k = -1 - medie armonică; k = 0 - medie geometrică; k = -2 - pătrat mediu.

Mediile sunt fie simple, fie ponderate.

medii ponderate sunt numite cantități care țin cont de faptul că unele variante ale valorilor atributului pot avea numere diferite și, prin urmare, fiecare variantă trebuie înmulțită cu acest număr. Cu alte cuvinte, „greutățile” sunt numerele de unități de populație din diferite grupuri, i.e. fiecare opțiune este „ponderată” de frecvența sa. Frecvența f se numește ponderea statistică sau medie de cântărire.

Se știe că tranzacțiile au fost efectuate în termen de 5 zile (5 tranzacții), numărul de acțiuni vândute la rata de vânzare a fost repartizat astfel:

1 - 800 ac. - 1010 ruble

2 - 650 ac. - 990 de ruble.

3 - 700 ak. - 1015 ruble.

4 - 550 ac. - 900 de ruble.

5 - 850 ak. - 1150 de ruble.

Raportul inițial pentru determinarea prețului mediu al acțiunilor este raportul dintre valoarea totală a tranzacțiilor (TCA) și numărul de acțiuni vândute (KPA):

OSS = 1010 800 + 990 650 + 1015 700+900 550+1150 850= 3 634 500;

CPA = 800+650+700+550+850=3550.

În acest caz, prețul mediu al acțiunilor a fost egal cu:

Este necesar să se cunoască proprietățile mediei aritmetice, care este foarte importantă atât pentru utilizarea ei, cât și pentru calculul ei. Există trei proprietăți principale care, cel mai mult, au condus la utilizarea pe scară largă a mediei aritmetice în calculele statistice și economice.

Proprietatea unu (zero): suma abaterilor pozitive ale valorilor individuale ale unei trăsături de la valoarea sa medie este egală cu suma abaterilor negative. Aceasta este o proprietate foarte importantă, deoarece arată că orice abateri (atât cu +, cât și cu -) datorate unor cauze aleatoare vor fi anulate reciproc.

Dovada:

Proprietatea doi (minim): suma abaterilor pătrate ale valorilor individuale ale trăsăturii de la media aritmetică este mai mică decât de la orice alt număr (a), adică este numărul minim.

Dovada.

Compuneți suma abaterilor pătrate de la variabila a:

Pentru a găsi extremul acestei funcții, este necesar să echivalăm derivata ei în raport cu a la zero:

De aici obținem:

Prin urmare, extremul sumei abaterilor pătrate este atins la . Acest extremum este minim, deoarece funcția nu poate avea un maxim.

Proprietatea trei: media aritmetică a unei constante este egală cu această constantă: la a = const.

Pe lângă acestea trei cele mai importante proprietăți medie aritmetică, există așa-numitele proprietăți de proiectare, care își pierd treptat semnificația din cauza utilizării computerelor electronice:

  • dacă valoarea individuală a atributului fiecărei unități este înmulțită sau împărțită cu un număr constant, atunci media aritmetică va crește sau scade cu aceeași valoare;
  • media aritmetică nu se va modifica dacă ponderea (frecvența) fiecărei valori caracteristice este împărțită la un număr constant;
  • dacă valorile individuale ale atributului fiecărei unități sunt reduse sau crescute cu aceeași sumă, atunci media aritmetică va scădea sau crește cu aceeași sumă.

Armonică medie. Această medie se numește medie aritmetică reciprocă, deoarece această valoare este utilizată atunci când k = -1.

Mijloace armonică simplă este utilizat atunci când ponderile valorilor caracteristice sunt aceleași. Formula sa poate fi derivată din formula de bază prin substituirea k = -1:

De exemplu, trebuie să calculăm viteza medie a două mașini care au parcurs aceeași cale, dar cu viteze diferite: prima la 100 km/h, a doua la 90 km/h.

Folosind metoda mediei armonice, calculăm viteza medie:

În practica statistică, ponderea armonică este mai des utilizată, a cărei formulă este:

Această formulă este utilizată în cazurile în care ponderile (sau volumele fenomenelor) pentru fiecare atribut nu sunt egale. În raportul original, numărătorul este cunoscut pentru a calcula media, dar numitorul este necunoscut.

De exemplu, atunci când calculăm prețul mediu, trebuie să folosim raportul dintre suma vândută și numărul de unități vândute. Nu cunoaștem numărul de unități vândute (vorbim despre diferite bunuri), dar cunoaștem sumele vânzărilor acestor diferite bunuri.

Să presupunem că doriți să aflați prețul mediu al bunurilor vândute:

Primim

Dacă utilizați aici formula mediei aritmetice, puteți obține un preț mediu care va fi nerealist:

Medie geometrică. Cel mai adesea, media geometrică își găsește aplicația în determinarea ratei medii de creștere (rate medii de creștere), atunci când valorile individuale ale trăsăturii sunt prezentate ca valori relative. De asemenea, este utilizat dacă este necesar să se găsească media dintre valorile minime și maxime ale unei caracteristici (de exemplu, între 100 și 1000000). Există formule pentru medie geometrică simplă și ponderată.

Pentru o medie geometrică simplă:

Pentru o medie geometrică ponderată:

RMS. Scopul principal al aplicării sale este măsurarea variației unei trăsături în populație (calculul abaterii standard).

Formula rădăcină medie pătratică simplă:

Formula pătratică medie ponderată:

Ca urmare, putem spune că rezolvarea cu succes a problemelor cercetării statistice depinde de alegerea corectă a tipului de valoare medie în fiecare caz concret.

Alegerea mediei presupune următoarea succesiune:

a) stabilirea unui indicator generalizator al populaţiei;

b) determinarea unui raport matematic de valori pentru un indicator de generalizare dat;

c) înlocuirea valorilor individuale cu valori medii;

d) calculul mediei folosind ecuația corespunzătoare.

Valorile medii se referă la generalizarea indicatorilor statistici care oferă o caracteristică rezumativă (finală) a fenomenelor sociale de masă, deoarece sunt construite pe baza unui număr mare de valori individuale ale unui atribut variabil. Pentru a clarifica esența valorii medii, este necesar să se ia în considerare caracteristicile formării valorilor semnelor acelor fenomene, în funcție de care se calculează valoarea medie.

Se știe că unitățile fiecărui fenomen de masă au numeroase caracteristici. Indiferent de aceste semne pe care le luăm, valorile sale pentru unitățile individuale vor fi diferite, se vor schimba sau, după cum se spune în statistici, variază de la o unitate la alta. Deci, de exemplu, salariul unui angajat este determinat de calificările sale, natura muncii, vechimea în muncă și o serie de alți factori și, prin urmare, variază într-o gamă foarte largă. Influența cumulativă a tuturor factorilor determină valoarea câștigurilor fiecărui angajat, cu toate acestea, putem vorbi despre salariile medii lunare ale lucrătorilor din diferite sectoare ale economiei. Aici operăm cu o valoare tipică, caracteristică a unui atribut variabil, referită la o unitate dintr-o populație mare.

Media reflectă asta general, care este tipic pentru toate unităţile populaţiei studiate. În același timp, echilibrează influența tuturor factorilor care acționează asupra mărimii atributului unităților individuale ale populației, ca și cum i-ar anula reciproc. Nivelul (sau mărimea) oricărui fenomen social este determinat de acțiunea a două grupuri de factori. Unele dintre ele sunt generale și principale, funcționează constant, strâns legate de natura fenomenului sau procesului studiat și formează că tipic pentru toate unitățile populației studiate, ceea ce se reflectă în valoarea medie. Alții sunt individual, acțiunea lor este mai puțin pronunțată și este episodică, aleatorie. Acţionează în sens invers, provoacă diferenţe între caracteristicile cantitative ale unităţilor individuale ale populaţiei, urmărind modificarea valorii constante a caracteristicilor studiate. Acțiunea semnelor individuale se stinge în valoarea medie. În influența cumulativă a factorilor tipici și individuali, care este echilibrată și anulată reciproc în caracteristicile de generalizare, legea numerelor mari.

În ansamblu, valorile individuale ale semnelor se contopesc într-o masă comună și, parcă, se dizolvă. Prin urmare și valoarea medie acționează ca „impersonal”, care se poate abate de la valorile individuale ale caracteristicilor, care nu coincid cantitativ cu niciuna dintre ele. Valoarea medie reflectă generală, caracteristică și tipică pentru întreaga populație datorită anulării reciproce în ea a diferențelor aleatorii, atipice dintre semnele unităților sale individuale, deoarece valoarea ei este determinată, așa cum ar fi, de rezultanta comună a tuturor. cauze.

Cu toate acestea, pentru ca valoarea medie să reflecte cea mai tipică valoare a unei trăsături, aceasta nu ar trebui determinată pentru nicio populație, ci numai pentru populațiile formate din unități omogene calitativ. Această cerință este condiția principală pentru aplicarea mediilor bazate științific și presupune o strânsă legătură între metoda mediilor și metoda grupărilor în analiza fenomenelor socio-economice. Prin urmare, valoarea medie este un indicator generalizator care caracterizează nivelul tipic al unei trăsături variabile pe unitate a unei populații omogene în condiții specifice de loc și timp.

Determinând, astfel, esența valorilor medii, trebuie subliniat că calcularea corectă a oricărei valori medii presupune îndeplinirea următoarelor cerințe:

  • omogenitatea calitativă a populaţiei pe care se calculează valoarea medie. Aceasta înseamnă că calcularea valorilor medii ar trebui să se bazeze pe metoda grupării, care asigură selectarea unor fenomene omogene, de același tip;
  • excluderea influenței asupra calculului valorii medii a cauzelor și factorilor aleatoriu, pur individuali. Acest lucru se realizează atunci când calcularea mediei se bazează pe un material suficient de masiv în care se manifestă funcționarea legii numerelor mari și toate accidentele se anulează reciproc;
  • la calcularea valorii medii, este important să se stabilească scopul calculării acesteia și așa-numitul indicator definitoriu-tel(proprietate) spre care ar trebui să fie orientată.

Indicatorul determinant poate acționa ca suma valorilor atributului mediu, suma valorilor sale reciproce, produsul valorilor sale etc. Relația dintre indicatorul definitoriu și valoarea medie este exprimată după cum urmează: dacă toate valorile atributului mediu sunt înlocuite cu valoarea medie, apoi suma sau produsul lor în acest caz nu va schimba indicatorul definitoriu. Pe baza acestei legături a indicatorului determinant cu valoarea medie se construiește un raport cantitativ inițial pentru calculul direct al valorii medii. Se numește capacitatea mediilor de a păstra proprietățile populațiilor statistice definind proprietatea.

Se numește valoarea medie calculată pentru populația în ansamblu media generală; valori medii calculate pentru fiecare grupă - medii de grup. Media generală reflectă trăsăturile generale ale fenomenului studiat, media de grup oferă o descriere a fenomenului care se dezvoltă în condițiile specifice acestui grup.

Metodele de calcul pot fi diferite, prin urmare, în statistică, se disting mai multe tipuri de medie, dintre care principalele sunt media aritmetică, media armonică și media geometrică.

LA analiză economică utilizarea valorilor medii este principalul instrument de evaluare a rezultatelor progresului științific și tehnologic, măsurilor sociale și căutarea rezervelor pentru dezvoltarea economiei. În același timp, trebuie amintit că concentrarea excesivă pe medii poate duce la concluzii părtinitoare atunci când se efectuează analize economice și statistice. Acest lucru se datorează faptului că valorile medii, fiind indicatori generalizatori, anulează și ignoră acele diferențe de caracteristici cantitative ale unităților individuale ale populației care există cu adevărat și pot fi de interes independent.

Tipuri de medii

În statistici, sunt utilizate diferite tipuri de medii, care sunt împărțite în două clase mari:

  • medii de putere (media armonică, medie geometrică, medie aritmetică, medie pătratică, medie cubică);
  • medii structurale (mod, mediana).

A calcula putere înseamnă trebuie utilizate toate valorile caracteristice disponibile. Modăși median sunt determinate doar de structura de distribuție, de aceea se numesc medii structurale, poziționale. Mediana și modul sunt adesea folosite ca o caracteristică medie în acele populații în care calculul exponențialului mediu este imposibil sau impractic.

Cel mai comun tip de medie este media aritmetică. Sub medie aritmetică se înțelege ca o astfel de valoare a unei caracteristici pe care ar avea-o fiecare unitate a populației dacă totalul tuturor valorilor caracteristicii ar fi distribuit uniform între toate unitățile populației. Calculul acestei valori se reduce la însumarea tuturor valorilor atributului variabil și la împărțirea sumei rezultate la numărul total de unități de populație. De exemplu, cinci muncitori au finalizat o comandă pentru fabricarea pieselor, în timp ce primul a produs 5 părți, al doilea - 7, al treilea - 4, al patrulea - 10, al cincilea - 12. Deoarece în datele inițiale valoarea fiecărei opțiunea a apărut o singură dată, pentru a determina producția medie a unui lucrător ar trebui să se aplice formula medie aritmetică simplă:

adică, în exemplul nostru, producția medie a unui lucrător este egală cu

Împreună cu media aritmetică simplă, ei studiază medie aritmetică ponderată. De exemplu, să calculăm vârsta medie a elevilor dintr-un grup de 20 de persoane a căror vârstă variază între 18 și 22 de ani, unde xi- variante ale caracteristicii medii, fi- frecventa, care arata de cate ori apare i-a valoarea în agregat (Tabelul 5.1).

Tabelul 5.1

Vârsta medie a elevilor

Aplicând formula mediei aritmetice ponderate, obținem:


Există o anumită regulă pentru alegerea unei medii aritmetice ponderate: dacă există o serie de date pe doi indicatori, pentru unul dintre care este necesar să se calculeze

valoarea medie și, în același timp, valorile numerice ale numitorului formulei sale logice sunt cunoscute, iar valorile numărătorului sunt necunoscute, dar pot fi găsite ca un produs al acești indicatori, atunci valoarea medie trebuie calculată folosind formula medie ponderată aritmetică.

În unele cazuri, natura datelor statistice inițiale este de așa natură încât calculul mediei aritmetice își pierde sensul și singurul indicator de generalizare nu poate fi decât un alt tip de valoare medie - armonică medie.În prezent, proprietățile de calcul ale mediei aritmetice și-au pierdut relevanța în calculul indicatorilor statistici generalizatori din cauza introducerii pe scară largă a calculatoarelor electronice. Valoarea armonică medie, care este de asemenea simplă și ponderată, a căpătat o mare importanță practică. Dacă sunt cunoscute valorile numerice ale numărătorului formulei logice, iar valorile numitorului sunt necunoscute, dar pot fi găsite ca o împărțire privată a unui indicator cu altul, atunci valoarea medie este calculată prin ponderea formula medie armonică.

De exemplu, să se știe că mașina a parcurs primii 210 km cu o viteză de 70 km/h, iar restul de 150 km cu o viteză de 75 km/h. Este imposibil să se determine viteza medie a mașinii pe toată durata călătoriei de 360 ​​km folosind formula mediei aritmetice. Deoarece opțiunile sunt vitezele în secțiuni individuale xj= 70 km/h și X2= 75 km/h, iar greutățile (fi) sunt segmentele corespunzătoare ale traseului, atunci produsele opțiunilor după greutăți nu vor avea nici semnificație fizică, nici economică. În acest caz, este logic să împărțiți segmentele traseului în viteze corespunzătoare (opțiuni xi), adică timpul petrecut la trecerea secțiunilor individuale ale căii (fi / xi). Dacă segmentele traseului sunt notate cu fi, atunci întregul drum este exprimat ca Σfi, iar timpul petrecut pe întreaga cale este exprimat ca Σ fi / xi , Apoi viteza medie poate fi găsită ca coeficientul distanței totale împărțit la timpul total petrecut:

În exemplul nostru, obținem:

Dacă atunci când utilizați greutatea armonică medie a tuturor opțiunilor (f) sunt egale, atunci în loc de cea ponderată, puteți utiliza medie armonică simplă (neponderată):

unde xi - opțiuni individuale; n- numărul de variante ale caracteristicii medii. În exemplul cu viteză, o medie armonică simplă ar putea fi aplicată dacă segmentele de drum parcurse cu viteze diferite ar fi egale.

Orice valoare medie ar trebui calculată astfel încât atunci când înlocuiește fiecare variantă a caracteristicii medii, valoarea unui indicator final, generalizant, care este asociat cu indicatorul mediu, să nu se modifice. Deci, atunci când înlocuiți vitezele reale pe secțiuni individuale ale traseului cu valoarea lor medie (viteza medie), distanța totală nu ar trebui să se modifice.

Forma (formula) valorii medii este determinată de natura (mecanismul) relației acestui indicator final cu cel mediat, prin urmare indicatorul final, a cărui valoare nu ar trebui să se modifice atunci când opțiunile sunt înlocuite cu valoarea lor medie , se numește indicator definitoriu. Pentru a obține formula medie, trebuie să compuneți și să rezolvați o ecuație folosind relația dintre indicatorul mediu cu cel determinant. Această ecuație este construită prin înlocuirea variantelor caracteristicii (indicatorului) medie cu valoarea medie a acestora.

Pe lângă media aritmetică și media armonică, în statistică se mai folosesc și alte tipuri (forme) de medie. Toate sunt cazuri speciale. medie gradului. Dacă calculăm toate tipurile de medii ale legii puterii pentru aceleași date, atunci valorile

vor fi la fel, aici se aplică regula majoranta mediu. Pe măsură ce exponentul mediei crește, la fel crește și media în sine. Cele mai frecvent utilizate formule în cercetarea practică pentru calcularea diferitelor tipuri de valori medii ale puterii sunt prezentate în tabel. 5.2.

Tabelul 5.2


Media geometrică se aplică atunci când este disponibilă. n factori de creștere, în timp ce valorile individuale ale trăsăturii sunt, de regulă, valori relative ale dinamicii, construite sub formă de valori în lanț, ca raport față de nivelul anterior al fiecărui nivel din seria dinamicii. Media caracterizează astfel rata medie de creștere. geometric înseamnă simplu calculate prin formula

Formulă medie geometrică ponderată are următoarea formă:

Formulele de mai sus sunt identice, dar una se aplică la coeficienții sau ratele de creștere actuale, iar a doua - la valorile absolute ale nivelurilor seriei.

rădăcină medie pătrată este utilizat la calcularea cu valorile funcțiilor pătrate, este utilizat pentru a măsura gradul de fluctuație a valorilor individuale ale atributului în jurul mediei aritmetice din seria de distribuție și este calculat prin formula

Pătrat mediu ponderat calculat folosind o formulă diferită:

Cubic mediu se utilizează la calcularea cu valorile funcțiilor cubice și se calculează prin formula

cubic mediu ponderat:

Toate valorile medii de mai sus pot fi reprezentate ca o formulă generală:

unde este valoarea medie; - valoarea individuală; n- numarul de unitati ale populatiei studiate; k- exponent, care determină tipul mediei.

Când utilizați aceleași date sursă, cu atât mai mult kîn formula generala puterea medie, cu atât mai mare este media. De aici rezultă că există o relație regulată între valorile puterii înseamnă:

Valorile medii descrise mai sus oferă o idee generalizată a populației studiate, iar din acest punct de vedere, semnificația lor teoretică, aplicată și cognitivă este incontestabilă. Dar se întâmplă ca valoarea mediei să nu coincidă cu niciuna dintre opțiunile cu adevărat existente, prin urmare, pe lângă mediile luate în considerare, în analiza statistică este recomandabil să se utilizeze valorile unor opțiuni specifice care ocupă un spațiu destul de mare. poziție definită într-o serie ordonată (clasată) de valori ale atributelor. Dintre aceste cantități, cele mai utilizate sunt structural, sau descriptiv, mediu- mod (Mo) și mediană (Me).

Modă- valoarea trasaturii care se intalneste cel mai des la aceasta populatie. În ceea ce privește seria variațională, modul este valoarea cea mai frecventă a seriei clasate, adică varianta cu cea mai mare frecvență. Moda poate fi folosită pentru a determina cele mai vizitate magazine, cel mai frecvent preț pentru orice produs. Ea arată dimensiunea caracteristicii unei părți semnificative a populației și este determinată de formulă

unde x0 este limita inferioară a intervalului; h- valoarea intervalului; fm- frecventa intervalului; fm_ 1 - frecvența intervalului anterior; fm+ 1 - frecvența intervalului următor.

Median varianta situată în centrul rândului clasat se numește. Mediana împarte seria în două părți egale, astfel încât pe ambele părți ale acesteia să existe același număr de unități de populație. În același timp, într-o jumătate a unităților populației, valoarea atributului variabil este mai mică decât mediana, în cealaltă jumătate este mai mare decât aceasta. Mediana este utilizată atunci când se examinează un element a cărui valoare este mai mare sau egală sau simultan mai mică sau egală cu jumătate dintre elementele seriei de distribuție. Mediana oferă o idee generală despre unde sunt concentrate valorile caracteristicii, cu alte cuvinte, unde este centrul lor.

Natura descriptivă a mediei se manifestă prin faptul că caracterizează limita cantitativă a valorilor atributului variabil, care sunt deținute de jumătate din unitățile populației. Problema găsirii medianei pentru o serie variațională discretă este rezolvată simplu. Dacă tuturor unităților seriei li se dau numere de serie, atunci numărul de serie al variantei mediane este definit ca (n + 1) / 2 cu un număr impar de membri n. Dacă numărul de membri ai seriei este un număr par, atunci mediana va fi media a două variante cu numere de serie n/ 2 și n / 2 + 1.

Atunci când se determină mediana în seria de variații de interval, se determină mai întâi intervalul în care se află (intervalul median). Acest interval se caracterizează prin faptul că suma sa acumulată de frecvențe este egală cu sau depășește jumătate din suma tuturor frecvențelor seriei. Calculul medianei seriei de variații de interval se efectuează conform formulei

Unde X0- limita inferioară a intervalului; h- valoarea intervalului; fm- frecventa intervalului; f- numărul de membri ai seriei;

∫m-1 - suma termenilor acumulați ai seriei premergătoare acesteia.

Împreună cu mediana pentru mai mult caracteristici complete structurile populației studiate folosesc și alte valori ale opțiunilor care ocupă o poziție destul de precisă în seria clasată. Acestea includ quartilesși decile. Quartilele împart seria prin suma frecvențelor în 4 părți egale, iar decilele - în 10 părți egale. Există trei quartile și nouă decile.

Mediana și modul, spre deosebire de media aritmetică, nu sting diferențele individuale în valorile unui atribut variabil și, prin urmare, sunt caracteristici suplimentare și foarte importante ale populației statistice. În practică, ele sunt adesea folosite în locul mediei sau împreună cu aceasta. Este deosebit de oportun să se calculeze mediana și modul în acele cazuri când populația studiată conține un anumit număr de unități cu o valoare foarte mare sau foarte mică a atributului variabil. Aceste valori ale opțiunilor, care nu sunt foarte caracteristice pentru populație, deși afectează valoarea mediei aritmetice, nu afectează valorile medianei și ale modului, ceea ce face din acestea din urmă indicatori foarte valoroși pentru analiza economică și statistică. .

Indicatori de variație

Scopul unui studiu statistic este de a identifica principalele proprietăți și modele ale populației statistice studiate. În procesul de prelucrare sumară a datelor de observație statistică, construim linii de distributie. Există două tipuri de serii de distribuție - atributive și variaționale, în funcție de faptul că atributul luat ca bază a grupării este calitativ sau cantitativ.

variațională numită serie de distribuţie construită pe o bază cantitativă. Valorile caracteristicilor cantitative pentru unitățile individuale ale populației nu sunt constante, diferă mai mult sau mai puțin unele de altele. Această diferență în valoarea unei trăsături se numește variatii. Se numesc valori numerice separate ale trăsăturii care apar în populația studiată opțiuni de valoare. Prezența variației în unitățile individuale ale populației se datorează influenței unui număr mare de factori asupra formării nivelului de trăsătură. Studiul naturii și gradului de variație a semnelor în unitățile individuale ale populației este problemă critică orice studiu statistic. Indicatorii de variație sunt utilizați pentru a descrie măsura variabilității trăsăturilor.

O altă sarcină importantă a cercetării statistice este de a determina rolul factorilor individuali sau al grupurilor acestora în variația anumitor trăsături ale populației. Pentru a rezolva o astfel de problemă în statistică, se folosesc metode speciale de studiere a variației, bazate pe utilizarea unui sistem de indicatori care măsoară variația. În practică, cercetătorul se confruntă cu destule cantitate mare opțiuni pentru valorile atributului, care nu oferă o idee despre distribuția unităților după valoarea atributului în agregat. Pentru a face acest lucru, toate variantele valorilor atributelor sunt aranjate în ordine crescătoare sau descrescătoare. Acest proces se numește clasamentul rândurilor. Seria clasată oferă imediat o idee generală a valorilor pe care caracteristica le ia în agregat.

Insuficiența valorii medii pentru o caracterizare exhaustivă a populației face necesară completarea valorilor medii cu indicatori care să permită evaluarea tipicității acestor medii prin măsurarea fluctuației (variației) trăsăturii studiate. Utilizarea acestor indicatori de variație face posibilă realizarea analizei statistice mai complete și mai semnificative, și astfel să se înțeleagă mai bine esența fenomenelor sociale studiate.

Cele mai simple semne de variație sunt minimși maxim - este cel mai mic şi cea mai mare valoare trăsătură în agregat. Se numește numărul de repetări ale variantelor individuale ale valorilor caracteristicilor rata de repetare. Să notăm frecvența de repetare a valorii caracteristicii fi, suma frecvențelor egală cu volumul populației studiate va fi:

Unde k- numărul de variante ale valorilor atributelor. Este convenabil să înlocuiți frecvențele cu frecvențe - w.i. Frecvență- indicator de frecvență relativă - poate fi exprimat în fracții de unitate sau procent și vă permite să comparați serii de variații cu un număr diferit de observații. Formal avem:

Pentru a măsura variația unei trăsături, diverse absolute și performanță relativă. Indicatorii absoluti de variație includ abaterea liniară medie, intervalul de variație, varianța, abaterea standard.

Variație de interval(R) este diferența dintre valorile maxime și minime ale trăsăturii în populația studiată: R= Xmax - Xmin. Acest indicator oferă doar cea mai generală idee despre fluctuația trăsăturii studiate, deoarece arată diferența doar între valorile limită ale variantelor. Nu are nicio legătură cu frecvențele din seria variațională, adică cu natura distribuției, iar dependența sa îi poate conferi un caracter instabil, aleatoriu numai din valorile extreme ale atributului. Gama de variație nu oferă nicio informație despre caracteristicile populațiilor studiate și nu ne permite să apreciem gradul de tipicitate al valorilor medii obținute. Sfera acestui indicator este limitată la populații destul de omogene, mai precis, el caracterizează variația unei trăsături, un indicator bazat pe luarea în considerare a variabilității tuturor valorilor trăsăturii.

Pentru a caracteriza variația unei trăsături, este necesar să se generalizeze abaterile tuturor valorilor de la orice valoare tipică pentru populația studiată. Astfel de indicatori

variațiile, cum ar fi abaterea liniară medie, varianța și abaterea standard, se bazează pe luarea în considerare a abaterilor valorilor atributului unităților individuale ale populației de la media aritmetică.

Abaterea liniară medie este media aritmetică a valorilor absolute ale abaterilor opțiunilor individuale de la media lor aritmetică:


Valoarea absolută (modulul) abaterii variantei de la media aritmetică; f- frecvență.

Prima formulă se aplică dacă fiecare dintre opțiuni apare în total o singură dată, iar a doua - în serie cu frecvențe inegale.

Există o altă modalitate de a media abaterile opțiunilor de la media aritmetică. Această metodă, care este foarte comună în statistică, se reduce la calcularea abaterilor pătrate ale opțiunilor de la valoarea medie și apoi la media lor. În acest caz, obținem un nou indicator de variație - varianța.

Dispersia(σ 2) - media abaterilor pătrate ale variantelor valorilor trăsăturilor de la valoarea lor medie:

A doua formulă este utilizată dacă variantele au ponderi proprii (sau frecvențe ale seriei de variații).

În analiza economică și statistică, se obișnuiește să se evalueze variația unui atribut cel mai adesea folosind abaterea standard. Deviație standard(σ) este rădăcina pătrată a varianței:

Abaterile medii liniare și pătrate medii arată cât de mult fluctuează valoarea atributului în medie pentru unitățile populației studiate și sunt exprimate în aceleași unități ca și variantele.

În practica statistică, devine adesea necesară compararea variației diferitelor caracteristici. De exemplu, este de mare interes să se compare variațiile vârstei personalului și calificările acestora, vechimea în muncă și salariile etc. Pentru astfel de comparații, indicatorii variabilității absolute a semnelor - media liniară și abaterea standard - nu sunt potriviți. . Este imposibil, de fapt, să comparăm fluctuația experienței de muncă, exprimată în ani, cu fluctuația salariilor, exprimată în ruble și copeici.

Când se compară variabilitatea diferitelor trăsături în agregat, este convenabil să se utilizeze indicatori relativi de variație. Acești indicatori sunt calculați ca raportul dintre indicatorii absoluti și media aritmetică (sau mediana). Folosind ca indicator absolut al variației intervalul de variație, abaterea liniară medie, abaterea standard, se obțin indicatorii relativi de fluctuație:


Cel mai frecvent utilizat indicator al volatilității relative, care caracterizează omogenitatea populației. Mulțimea este considerată omogenă dacă coeficientul de variație nu depășește 33% pentru distribuții apropiate de normal.