Berekening van het rekenkundig gemiddelde, gewogen volgens de momentenmethode. Eigenschappen van het rekenkundig gemiddelde en de berekening ervan met behulp van de momentenmethode Algoritme voor het vinden van het gemiddelde met behulp van de momentenmethode

Methode van momenten stelt de momenten van de theoretische verdeling gelijk aan de momenten van de empirische verdeling (verdeling opgebouwd uit observaties). Uit de resulterende vergelijkingen worden schattingen van de distributieparameters gevonden. Voor een verdeling met twee parameters worden bijvoorbeeld de eerste twee momenten (respectievelijk het gemiddelde en de variantie van de verdeling, m en s) gelijkgesteld aan de eerste twee empirische (steekproef)momenten (respectievelijk het gemiddelde en de steekproefvariantie). , waarna de schatting wordt uitgevoerd.

Waar A een voorwaardelijke nul is die gelijk is aan de optie met de maximale frequentie (het midden van het interval met de maximale frequentie), is h de intervalstap,

Doel van de dienst. Met behulp van een online calculator wordt de gemiddelde waarde berekend volgens de momentenmethode. Het resultaat van de beslissing wordt gepresenteerd in Word-formaat.

Instructies. Om een ​​oplossing te verkrijgen, moet u de initiële gegevens invullen en rapportparameters selecteren voor opmaak in Word.

Algoritme voor het vinden van het gemiddelde met behulp van de methode van momenten

Voorbeeld. De arbeidstijd besteed aan een homogene technologische operatie werd als volgt onder de werknemers verdeeld:

Het is vereist om de gemiddelde hoeveelheid bestede werktijd en de standaardafwijking te bepalen met behulp van de momentenmethode; de variatiecoëfficiënt; modus en mediaan.
Tabel voor het berekenen van indicatoren.
GroepenMiddelpunt van het interval, x iHoeveelheid, f ix ik f ikGeaccumuleerde frequentie, S(x-x) 2 f
5 - 10 7.5 20 150 20 4600.56
15 - 20 17.5 25 437.5 45 667.36
20 - 25 22.5 50 1125 95 1.39
25 - 30 27.5 30 825 125 700.83
30 - 35 32.5 15 487.5 140 1450.42
35 - 40 37.5 10 375 150 2200.28
150 3400 9620.83

Mode

waarbij x 0 het begin is van het modale interval; h – intervalwaarde; f 2 – frequentie die overeenkomt met het modale interval; f 1 – premodale frequentie; f 3 – postmodale frequentie.
We kiezen 20 als begin van het interval, omdat dit interval het grootste getal bevat.

De meest voorkomende waarde van de serie is 22,78 minuten.
Mediaan
De mediaan is het interval 20 - 25, omdat in dit interval is de geaccumuleerde frequentie S groter dan het mediaangetal (de mediaan is het eerste interval waarvan de geaccumuleerde frequentie S groter is dan de helft van de totale som van frequenties).

Dus 50% van de eenheden in de populatie zal minder dan 23 minuten duren.
.



We vinden A = 22,5, intervalstap h = 5.
Beteken kwadratische afwijkingen volgens de methode van momenten.
x qx*ikx * ik f ik2 v. ik
7.5 -3 -60 180
17.5 -1 -25 25
22.5 0 0 0
27.5 1 30 30
32.5 2 30 60
37.5 3 30 90
5 385

min.

Standaardafwijking.
min.
De variatiecoëfficiënt- een maatstaf voor de relatieve spreiding van populatiewaarden: laat zien welk deel van de gemiddelde waarde van deze waarde de gemiddelde spreiding is.

Aangezien v>30%, maar v<70%, то вариация умеренная.

Voorbeeld

Om de distributiereeksen te evalueren, vinden we de volgende indicatoren:

Gewogen gemiddelde

Gemiddelde waarde van het bestudeerde kenmerk volgens de momentenmethode.

waarbij A een voorwaardelijke nul is die gelijk is aan de optie met de maximale frequentie (het midden van het interval met de maximale frequentie), is h de intervalstap.

Methoden voor het berekenen van het rekenkundig gemiddelde (eenvoudig en gewogen rekenkundig gemiddelde, met behulp van de momentenmethode)

We bepalen de gemiddelde waarden:

Modus (Ma) =11, omdat deze optie komt het vaakst voor in de variatiereeksen (p = 6).

Mediaan (Me) - het serienummer van de variant die de middelste positie inneemt = 23, deze plaats in de variatiereeks wordt ingenomen door de variant gelijk aan 11. Met het rekenkundig gemiddelde (M) kunt u het gemiddelde niveau van de variant zo volledig mogelijk karakteriseren eigenschap die wordt bestudeerd. Om het rekenkundig gemiddelde te berekenen, worden twee methoden gebruikt: de rekenkundig gemiddelde-methode en de methode van momenten.

Als de frequentie van voorkomen van elke optie in de variatiereeks gelijk is aan 1, wordt het eenvoudige rekenkundige gemiddelde berekend met behulp van de rekenkundige gemiddeldemethode: M = .

Indien de frequentie van voorkomen van een variant in een variatiereeks afwijkt van 1, dan wordt het gewogen rekenkundig gemiddelde berekend met behulp van de rekenkundig gemiddelde methode:

Volgens de methode van momenten: A - voorwaardelijk gemiddelde,

M = A + =11 += 10,4 d=V-A, A=Mo=11

Als het aantal opties in de variatiereeks groter is dan 30, wordt er een gegroepeerde reeks samengesteld. Een gegroepeerde reeks construeren:

1) bepaling van Vmin en Vmax Vmin=3, Vmax=20;

2) bepaling van het aantal groepen (volgens de tabel);

3) berekening van het interval tussen groepen ik = 3;

4) het bepalen van het begin en einde van groepen;

5) bepaling van de frequentie van de variant van elke groep (tabel 2).

tafel 2

Methodologie voor het construeren van een gegroepeerde reeks

Duur

behandeling in dagen

n=45 p=480 p=30 2 p=766

Het voordeel van een gegroepeerde variatiereeks is dat de onderzoeker niet met elke optie werkt, maar alleen met opties die gemiddeld zijn voor elke groep. Dit vereenvoudigt de berekeningen van het gemiddelde aanzienlijk.

De waarde van een bepaald kenmerk is niet voor alle leden van de bevolking hetzelfde, ondanks de relatieve homogeniteit ervan. Dit kenmerk van de statistische populatie wordt gekenmerkt door een van de groepseigenschappen van de algemene bevolking: eigenschap diversiteit. Laten we bijvoorbeeld een groep 12-jarige jongens nemen en hun lengte meten. Na de berekeningen zal het gemiddelde niveau van dit kenmerk 153 cm zijn. Maar het gemiddelde karakteriseert de algemene maat van het onderzochte kenmerk. Onder jongens van een bepaalde leeftijd zijn er jongens met een lengte van 165 cm of 141 cm. Hoe meer jongens een andere lengte hebben dan 153 cm, hoe groter de diversiteit van dit kenmerk in de statistische populatie.

Statistieken stellen ons in staat deze eigenschap te karakteriseren aan de hand van de volgende criteria:

limiet (lim),

amplitude (ampère),

standaardafwijking ( j) ,

Variatiecoëfficiënt (Cv).

Begrenzing bepaald door de extreme waarden van de variant in de variatiereeks:

lim=Vmin /Vmax

Amplitude (Amp) - verschil tussen extreme opties:

Amp=Vmax -Vmin

Deze waarden houden alleen rekening met de diversiteit van extreme opties en laten niet toe informatie te verkrijgen over de diversiteit van een kenmerk in het geheel, rekening houdend met de interne structuur ervan. Daarom kunnen deze criteria worden gebruikt om diversiteitskenmerken te benaderen, vooral bij een klein aantal waarnemingen (n<30).

variatiereeks medische statistieken

Mav - berekend met behulp van de momentmethode = 61,6 kg

Het rekenkundig gemiddelde heeft drie eigenschappen.

1. In de variatiereeksen neemt het gemiddelde de middenpositie in . In een strikt symmetrische rij: M = M 0 = M e.

2. Het gemiddelde is een generaliserende waarde en willekeurige fluctuaties en verschillen in individuele gegevens zijn niet zichtbaar achter het gemiddelde; het laat zien wat typerend is voor de hele populatie . Er wordt naar het gemiddelde gekeken wanneer het nodig is om de willekeurige invloed van individuele factoren uit te sluiten, gemeenschappelijke kenmerken en bestaande patronen te identificeren en een volledig en diepgaand begrip te verkrijgen van de meest algemene en karakteristieke kenmerken van de hele groep.

3. De som van de afwijkingen van alle opties ten opzichte van het gemiddelde is nul : S (V-M)= 0 . Dit gebeurt omdat de gemiddelde waarde groter is dan de maat van sommige varianten en kleiner dan de maten van andere varianten.

Met andere woorden: de werkelijke afwijking is een variant van het werkelijke gemiddelde (D=v-M) kan positief of negatief zijn, dus de som S alle "+"d en "-"d zijn gelijk aan nul.

Deze eigenschap van het gemiddelde wordt gebruikt om de juistheid van berekeningen te controleren M. Als de som van de afwijkingen van het gemiddelde nul is, kunnen we concluderen dat het gemiddelde correct is berekend. De methode van momenten voor het bepalen M. Immers, als het voorwaardelijk gemiddelde is A zal gelijk zijn aan waar M, dan is de som van de afwijkingen van de variant van het voorwaardelijke gemiddelde gelijk aan nul.

De rol van gemiddelde waarden in de biologie is buitengewoon groot. Enerzijds worden ze gebruikt om verschijnselen als geheel te karakteriseren, anderzijds zijn ze noodzakelijk voor het beoordelen van individuele grootheden. Door individuele waarden met gemiddelden te vergelijken, worden voor elk van hen waardevolle kenmerken verkregen. Het gebruik van gemiddelden vereist een strikte naleving van het beginsel van bevolkingshomogeniteit. Schending van dit principe vervormt het idee van echte processen.

Het berekenen van gemiddelden uit een sociaal-economisch heterogene populatie maakt ze fictief en vertekend. Om gemiddelden correct te kunnen gebruiken, moet men er daarom zeker van zijn dat ze homogene statistische populaties karakteriseren.

KENMERKEN VAN EIGENSCHAPPENDIVERSITEIT IN

STATISTISCHE SAMENVATTING

De waarde van een bepaald kenmerk is niet voor alle leden van de bevolking hetzelfde, ondanks de relatieve homogeniteit ervan. In een groep kinderen die homogeen zijn qua leeftijd, geslacht en woonplaats, verschilt de lengte van elk kind bijvoorbeeld van de groei van leeftijdsgenoten. Hetzelfde kan gezegd worden over het aantal bezoeken van individuen aan de kliniek, het niveau van bloedeiwitten bij elke patiënt met reuma, het niveau van de bloeddruk bij individuen met hypertensie, enz. Dit toont de diversiteit en variabiliteit van de tekenen de populatie die wordt bestudeerd. Variabiliteit kan aantoonbaar worden geïllustreerd aan de hand van het voorbeeld van groei in groepen adolescenten.



Statistieken maken het mogelijk dit te karakteriseren aan de hand van speciale criteria die de mate van diversiteit van elk kenmerk in een bepaalde groep bepalen. Dergelijke criteria omvatten limiet (lim), serieamplitude (Ben), standaarddeviatie (s) en variatiecoëfficiënt (C v). Omdat elk van deze criteria zijn eigen onafhankelijke betekenis heeft, moeten we er afzonderlijk bij stilstaan.

Begrenzing- de variant in de variatiereeks wordt bepaald door de uiterste waarden

Amplitude (Ben) - verschil tussen extreme opties

Limiet en amplitude - geef bepaalde informatie over de mate van groeidiversiteit in elke groep. Zowel de limiet als de amplitude van de reeks hebben echter één belangrijk nadeel. Ze houden alleen rekening met de diversiteit van extreme varianten en laten niet toe informatie te verkrijgen over de diversiteit van een eigenschap als geheel, rekening houdend met de interne structuur ervan. Feit is dat diversiteit zich niet zozeer manifesteert in extreme varianten, maar in de analyse van de gehele interne structuur van de groep. Daarom kunnen deze criteria worden gebruikt om diversiteitskenmerken te benaderen, vooral bij een klein aantal waarnemingen (n<30).

De meest volledige beschrijving van de diversiteit van een eigenschap in het geheel wordt gegeven door de zogenaamde standaardafwijking, aangegeven met de Griekse letter "sigma" -S.

Er zijn twee manieren om de standaarddeviatie te berekenen: rekenkundig gemiddelde en methode van momenten.

Bij de rekenmethode voor het rekenkundig gemiddelde wordt de formule gebruikt waar D- ware afwijkingsvariant van het ware gemiddelde (V-M).

De formule wordt gebruikt voor een klein aantal waarnemingen (n<30), когда в вариационном ряду все частоты p= 1.

Bij R> 1 gebruik een formule als deze:

Als er computertechnologie beschikbaar is, wordt deze formule ook voor een groot aantal waarnemingen gebruikt.

Deze formule is bedoeld om "sigma" te bepalen met behulp van de momentenmethode:

Waar:A- voorwaardelijke afwijking van het voorwaardelijke gemiddelde ( V-A); P- frequentie van voorkomen voor varianten; N- nummer optie; i- de grootte van het interval tussen groepen.

Deze methode wordt gebruikt in gevallen waarin er geen computertechnologie is en de variatiereeks omslachtig is, zowel vanwege het grote aantal waarnemingen als vanwege varianten die worden uitgedrukt in getallen met meerdere cijfers. Wanneer het aantal waarnemingen 30 of minder is, op het moment van de tweede graad P vervangen voor (P-1).

Zoals blijkt uit de standaardafwijkingsformule (4), bevat de noemer ( P-1), d.w.z. wanneer het aantal waarnemingen gelijk is aan of kleiner is dan 30 (n £ 30), is het noodzakelijk om ( P-1). Als, bij het bepalen van het rekenkundig gemiddelde M houd rekening met alle elementen van de reeks en bereken vervolgens A, het is noodzakelijk om niet alle gevallen te nemen, maar één minder (p-1).

Bij een groot aantal waarnemingen (n>30) wordt de noemer van de formule genomen P, Dus als eenheid verandert de berekeningsresultaten niet en wordt daarom automatisch weggelaten.

Opgemerkt moet worden dat de standaardafwijking een benoemde waarde is, daarom moet het een aanduiding hebben die gemeenschappelijk is voor de variant en het rekenkundig gemiddelde (afmeting - kg, zie km, enz.).

De berekening van de standaardafwijking met behulp van de momentenmethode wordt uitgevoerd na het berekenen van de gemiddelde waarde.

Er is nog een criterium dat het niveau van diversiteit van attribuutwaarden in het geheel kenmerkt: variatiecoëfficiënt.

Variatiecoëfficiënt (Cv)- is een relatieve maatstaf voor diversiteit, aangezien deze wordt berekend als een percentage van de standaardafwijking (a) naar rekenkundig gemiddelde (M). De formule voor de variatiecoëfficiënt is:

Voor een benaderende beoordeling van de mate van diversiteit van een eigenschap worden de volgende gradaties van de variatiecoëfficiënt gebruikt. Als de coëfficiënt meer dan 20% bedraagt, wordt een sterke diversiteit opgemerkt; bij 20-10% - gemiddeld, en als de coëfficiënt minder dan 10% is, zijn ze van mening dat de diversiteit zwak is.

De variatiecoëfficiënt wordt gebruikt bij het vergelijken van de mate van diversiteit van kenmerken met verschillen in de grootte van kenmerken of hun ongelijke afmetingen. Laten we zeggen dat we de mate van diversiteit in lichaamsgewicht bij pasgeborenen en 5-jarige kinderen moeten vergelijken. Het is duidelijk dat pasgeborenen altijd minder sigma zullen hebben dan zevenjarige kinderen, omdat hun individuele gewicht lager is. De standaardafwijking zal kleiner zijn als de waarde van het attribuut zelf kleiner is. In dit geval is het, om het verschil in de mate van diversiteit te bepalen, noodzakelijk om niet te focussen op de standaardafwijking, maar op de relatieve maatstaf van diversiteit - de variatiecoëfficiënt Cv.

De variatiecoëfficiënt is ook van groot belang voor het beoordelen en vergelijken van de mate van diversiteit van verschillende kenmerken met verschillende dimensies. Aan de hand van de standaarddeviatie is het nog steeds onmogelijk om het verschil in de mate van diversiteit van deze kenmerken te beoordelen. Om dit te doen, is het noodzakelijk om de variatiecoëfficiënt - Cv te gebruiken.

De standaarddeviatie hangt samen met de structuur van de distributiereeksen van het kenmerk. Schematisch kan dit als volgt worden weergegeven.

De statistische theorie heeft bewezen dat bij een normale verdeling 68% van alle gevallen binnen M±s ligt, 95,5% van alle gevallen binnen M±2s en 99,7% van alle gevallen waaruit de populatie bestaat binnen M±3s ligt. . Zo bestrijkt М±3s vrijwel de gehele variatiereeks.

Deze theoretische positie van de statistiek over de regelmatigheden van de structuur van een reeks is van groot belang voor de praktische toepassing van de standaarddeviatie. U kunt deze regel gebruiken om de vraag naar de typiciteit van de gemiddelde waarde te verduidelijken. Als 95% van alle varianten binnen M±2s ligt, dan is het gemiddelde typisch voor een bepaalde reeks en is het niet nodig om het aantal waarnemingen in totaal te vergroten. Om de typiciteit van het gemiddelde te bepalen, wordt de werkelijke verdeling vergeleken met de theoretische verdeling door sigma-afwijkingen te berekenen.

De praktische betekenis van de standaarddeviatie is ook dat weten M En S, kun je de nodige variatiereeksen construeren voor praktisch gebruik. Sigma ( S) worden ook gebruikt om de mate van diversiteit van homogene kenmerken te vergelijken, bijvoorbeeld bij het vergelijken van fluctuaties (variabiliteit) in de groei van kinderen in stedelijke en landelijke gebieden. Sigma kennen ( S), kunt u de variatiecoëfficiënt (Cv) berekenen, die nodig is om de mate van diversiteit van kenmerken, uitgedrukt in verschillende meeteenheden (centimeters, kilogrammen, enz.), te vergelijken. Hierdoor kunnen we stabielere (constante) en minder stabiele tekens in het geheel identificeren.

Variatiecoëfficiënten vergelijken (CV), het is mogelijk om conclusies te trekken over wat het meest stabiele kenmerk in de reeks kenmerken is. Standaardafwijking (S) wordt ook gebruikt om individuele kenmerken van één object te evalueren. De standaarddeviatie geeft aan hoeveel sigma's ( S) van gemiddeld (M) individuele metingen worden afgewezen.

Standaardafwijking ( S) kan worden gebruikt in de biologie en ecologie bij het ontwikkelen van norm- en pathologische problemen.

Ten slotte is de standaardafwijking een belangrijk onderdeel van de formule t m- gemiddelde fout van het rekenkundig gemiddelde (representativiteitsfout):

Waar t m- gemiddelde fout van het rekenkundig gemiddelde (fout van representativiteit), P- aantal waarnemingen.

Representativiteit. De belangrijkste theoretische grondslagen van representativiteit zijn hierboven belicht in de paragraaf over steekproeven en populaties. Representativiteit betekent de representativiteit in de steekproef van alle in aanmerking genomen kenmerken (geslacht, leeftijd, beroep, anciënniteit, enz.) van observatie-eenheden die deel uitmaken van de algemene bevolking. Deze representativiteit van de steekproefpopulatie ten opzichte van de algemene bevolking wordt bereikt met behulp van speciale selectiemethoden, die hieronder worden beschreven.

Het beoordelen van de betrouwbaarheid van onderzoeksresultaten is gebaseerd op de theoretische grondslagen van representativiteit.

BEOORDELING VAN DE BETROUWBAARHEID VAN ONDERZOEKSRESULTATEN

De betrouwbaarheid van statistische indicatoren moet worden begrepen als de mate waarin ze overeenkomen met de realiteit die ze vertegenwoordigen. Betrouwbare resultaten zijn resultaten die de objectieve werkelijkheid niet vertekenen en correct weerspiegelen.

Het beoordelen van de betrouwbaarheid van onderzoeksresultaten betekent bepalen met welke waarschijnlijkheid het mogelijk is om de resultaten van een steekproefpopulatie over te dragen naar de gehele populatie.

In de meeste onderzoeken heeft de onderzoeker in de regel te maken met een deel van het fenomeen dat wordt bestudeerd, en moet hij de conclusies van de resultaten van een dergelijk onderzoek overbrengen naar het hele fenomeen als geheel - naar de algemene bevolking.

Een beoordeling van de betrouwbaarheid is dus noodzakelijk om vanuit een deel van een fenomeen het fenomeen als geheel, zijn patronen, te kunnen beoordelen.

Bij het beoordelen van de betrouwbaarheid van de onderzoeksresultaten wordt het volgende bepaald:

1) representativiteitsfouten (gemiddelde fouten van rekenkundige gemiddelden en relatieve waarden) - T;

2) betrouwbaarheidsgrenzen van gemiddelde (of relatieve) waarden;

3) betrouwbaarheid van het verschil tussen gemiddelde (of relatieve) waarden
(volgens criterium
T );

4) de betrouwbaarheid van de verschillen tussen de vergeleken groepen volgens het criteriumc2 .

1. Bepaling van de gemiddelde fout van de gemiddelde (of relatieve) waarde (fout van representativiteit) - d.w.z.

Representativiteitsfout ( M) is de belangrijkste statistische grootheid die nodig is om de betrouwbaarheid van de onderzoeksresultaten te beoordelen. Deze fout treedt op in gevallen waarin het nodig is een fenomeen als geheel in delen te karakteriseren. Deze fouten zijn onvermijdelijk. Ze vloeien voort uit de aard van steekproefonderzoek; de populatie kan alleen op basis van de steekproef worden gekarakteriseerd met enige fout, gemeten aan de hand van de representativiteitsfout.

Representativiteitsfouten kunnen niet worden verward met het gebruikelijke idee van fouten: methodologisch, meetnauwkeurigheid, rekenkunde, enz.

De omvang van de representativiteitsfout bepaalt hoeveel de resultaten verkregen tijdens steekproefobservatie verschillen van de resultaten die zouden kunnen worden verkregen tijdens een continu onderzoek van alle elementen van de algemene bevolking, zonder uitzondering.

Dit is het enige type fout waarmee statistische methoden rekening houden en dat niet kan worden geëlimineerd tenzij de overgang naar continu onderzoek wordt gemaakt. Representativiteitsfouten kunnen worden teruggebracht tot een tamelijk kleine waarde, d.w.z. tot de toegestane foutwaarde. Dit gebeurt door voldoende waarnemingen in de steekproef te betrekken. (P).

Elke gemiddelde waarde is M(gemiddelde behandelingsduur, gemiddelde lengte, gemiddeld lichaamsgewicht, gemiddeld eiwitgehalte in het bloed, enz.), evenals elke relatieve waarde - R(sterftecijfer, ziektecijfer, enz.) moeten worden gepresenteerd met hun gemiddelde fout - T. Dus het rekenkundig gemiddelde van de steekproefpopulatie (M) heeft een representativiteitsfout, die de gemiddelde fout van het rekenkundig gemiddelde (mm) wordt genoemd en wordt bepaald door de formule:

Zoals uit deze formule blijkt, is de waarde van de gemiddelde fout van het rekenkundig gemiddelde direct evenredig met de mate van diversiteit van het kenmerk en omgekeerd evenredig met de vierkantswortel van het aantal waarnemingen. Bijgevolg wordt de omvang van deze fout verminderd bij het bepalen van de mate van diversiteit ( S) is mogelijk door het aantal waarnemingen te vergroten.

De methode om een ​​voldoende aantal waarnemingen voor een steekproefonderzoek te bepalen is op dit principe gebaseerd.

Relatieve waarden (R), verkregen uit een steekproefstudie hebben ook hun eigen representativiteitsfout, die de gemiddelde relatieve fout wordt genoemd en wordt aangegeven Dhr

Om de gemiddelde relatieve fout te bepalen (R) de volgende formule wordt gebruikt:

Waar R- relatieve waarde. Als de indicator wordt uitgedrukt als een percentage, dan q=100-P, Als R- in ppm dus q=1000-P, Als R- in prodecimalen dus q= 10000-R enz.; P- aantal waarnemingen. Als het aantal waarnemingen kleiner is dan 30, moet de noemer zijn ( P - 1 ).

Elk rekenkundig gemiddelde of elke relatieve waarde die uit een steekproef wordt verkregen, moet met zijn eigen gemiddelde fout worden gepresenteerd. Dit maakt het mogelijk om de betrouwbaarheidsgrenzen van gemiddelde en relatieve waarden te berekenen, evenals om de betrouwbaarheid van het verschil tussen de vergeleken indicatoren (onderzoeksresultaten) te bepalen.

4. Even en oneven.

Bij even variatiereeksen wordt de som van de frequenties of het totale aantal waarnemingen uitgedrukt door een even getal, bij oneven door een oneven getal.

5. Symmetrisch en asymmetrisch.

In een symmetrische variatiereeks vallen alle soorten gemiddelde waarden samen of liggen ze heel dichtbij (modus, mediaan, rekenkundig gemiddelde).

Afhankelijk van de aard van de fenomenen die worden bestudeerd, van de specifieke taken en doelstellingen van statistisch onderzoek, evenals van de inhoud van het bronmateriaal, in sanitaire statistieken De volgende typen gemiddelden worden gebruikt:

· structurele gemiddelden (modus, mediaan);

· rekenkundig gemiddelde;

· harmonisch gemiddelde;

· geometrisch gemiddelde;

· gemiddeld progressief.

Mode (M o) - de waarde van het variërende kenmerk, dat vaker voorkomt in de onderzochte populatie, namelijk optie die overeenkomt met de hoogste frequentie. Ze vinden het rechtstreeks uit de structuur van de variatiereeks, zonder toevlucht te nemen tot berekeningen. Het is meestal een waarde die heel dicht bij het rekenkundig gemiddelde ligt, wat in de praktijk erg handig is.

Mediaan (M e) - het verdelen van de variatiereeksen (gerangschikt, d.w.z. de waarden van de optie zijn gerangschikt in oplopende of aflopende volgorde) in twee gelijke helften. De mediaan wordt berekend met behulp van de zogenaamde oneven reeks, die wordt verkregen door opeenvolgende sommatie van frequenties. Als de som van de frequenties overeenkomt met een even getal, wordt conventioneel het rekenkundig gemiddelde van de twee gemiddelde waarden als mediaan genomen.

Modus en mediaan worden gebruikt in het geval van een open populatie, d.w.z. wanneer de grootste of kleinste opties geen exact kwantitatief kenmerk hebben (bijvoorbeeld tot 15 jaar, 50 jaar en ouder, enz.). In dit geval kan het rekenkundig gemiddelde (parametrische kenmerken) niet worden berekend.

Gemiddeld Ik ben rekenkundig - de meest voorkomende waarde. Het rekenkundig gemiddelde wordt vaak aangegeven met M.

Er zijn eenvoudige en gewogen rekenkundige gemiddelden.

Eenvoudig rekenkundig gemiddelde berekend:

- in gevallen waarin de populatie wordt vertegenwoordigd door een eenvoudige lijst met kennis over een kenmerk voor elke eenheid;

- als het aantal herhalingen van elke optie niet kan worden bepaald;

- als het aantal herhalingen van elke optie dicht bij elkaar ligt.

Het eenvoudige rekenkundige gemiddelde wordt berekend met behulp van de formule:

waarbij V - individuele waarden van het kenmerk; n - aantal individuele waarden; - sommatieteken.

Het eenvoudige gemiddelde is dus de verhouding tussen de som van de varianten en het aantal waarnemingen.

Voorbeeld: bepaal de gemiddelde verblijfsduur in een bed voor 10 patiënten met longontsteking:

16 dagen - 1 patiënt; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

bed-dag

Rekenkundig gemiddelde gewogen wordt berekend in gevallen waarin individuele waarden van een kenmerk worden herhaald. Het kan op twee manieren worden berekend:

1. Direct (rekenkundig gemiddelde of directe methode) volgens de formule:

waarbij P de frequentie (aantal gevallen) van observaties van elke optie is.

Het gewogen rekenkundig gemiddelde is dus de verhouding van de som van de producten van variant en frequentie tot het aantal waarnemingen.

2. Door afwijkingen van het voorwaardelijke gemiddelde te berekenen (met behulp van de momentenmethode).

De basis voor het berekenen van het gewogen rekenkundig gemiddelde is:

– gegroepeerd materiaal volgens varianten van een kwantitatief kenmerk;

— alle opties moeten worden gerangschikt in oplopende of aflopende volgorde van de waarde van het attribuut (gerangschikte rij).

Om te berekenen met behulp van de momentenmethode is een voorwaarde dat alle intervallen even groot zijn.

Met behulp van de momentenmethode wordt het rekenkundig gemiddelde berekend met behulp van de formule:

,

waarbij Mo het voorwaardelijke gemiddelde is, dat vaak wordt beschouwd als de waarde van het kenmerk dat overeenkomt met de hoogste frequentie, d.w.z. wat vaker wordt herhaald (Mode).

i is de waarde van het interval.

a is een voorwaardelijke afwijking van de voorwaarden van het gemiddelde, wat een opeenvolgende reeks getallen is (1, 2, enz.) met een + teken voor varianten van grote voorwaardelijke gemiddelden en met een – teken (–1, –2, enz.) .) voor varianten die onder het conventionele gemiddelde liggen. De voorwaardelijke afwijking van de variant die als voorwaardelijk gemiddelde wordt genomen, is 0.

P - frequenties.

Totaal aantal waarnemingen of n.

Voorbeeld: bepaal rechtstreeks de gemiddelde lengte van 8-jarige jongens (tabel 1).

tafel 1

Hoogte cm

jongens p

Centraal

optie V

De centrale optie - het midden van het interval - wordt gedefinieerd als de semi-som van de beginwaarden van twee aangrenzende groepen:

; enz.

Het product VP wordt verkregen door de centrale varianten te vermenigvuldigen met de frequenties; enz. Vervolgens worden de resulterende producten toegevoegd en verkregen , dat wordt gedeeld door het aantal waarnemingen (100) en er wordt een gewogen rekenkundig gemiddelde verkregen.

cm.

We zullen hetzelfde probleem oplossen met behulp van de momentenmethode, waarvoor de volgende tabel 2 is samengesteld:

tafel 2

Hoogte in cm (V)

jongens p

We nemen 122 als Mo, omdat van de 100 observaties hadden 33 mensen een lengte van 122 cm. We vinden voorwaardelijke afwijkingen (a) van het voorwaardelijke gemiddelde in overeenstemming met het bovenstaande. Vervolgens verkrijgen we het product van voorwaardelijke afwijkingen en frequenties (aP) en vatten we de verkregen waarden samen (). Het resultaat is 17. Ten slotte vervangen we de gegevens in de formule.

Bij een groot aantal waarnemingen of een grote numerieke waarde wordt de optie gebruikt

Een vereenvoudigde manier om het rekenkundig gemiddelde te berekenen is de methode van momenten.

M = EEN+ iSar

waarbij M het rekenkundig gemiddelde is; A - voorwaardelijk gemiddelde; i - optie voor interval tussen groepen;

S - sommatieteken.; a - voorwaardelijke afwijking van elke optie van het voorwaardelijke gemiddelde;

p - frequentie van voorkomen van de variant; n is het aantal waarnemingen.

Een voorbeeld van het berekenen van het rekenkundig gemiddelde met behulp van de methode van momenten (gemiddeld lichaamsgewicht

jongens vanaf 18 jaar)

V(n in kg) R een (V-A) A. R
+2 +4
+1 +3
M o =62
-1 -6
-2 -8
-3 -3
n = 25 Sar = - 10kg

Stappen voor het berekenen van het gemiddelde met behulp van de momentenmethode:

2) we bepalen "a" - de voorwaardelijke afwijking van de opties van het voorwaardelijke gemiddelde, hiervoor trekken we het voorwaardelijke gemiddelde van elke optie af: a = V - A, (bijvoorbeeld a = 64 - 62 = +2, enz. .).

3) we vermenigvuldigen de voorwaardelijke afwijking “a” met de frequentie “p” van elke optie en verkrijgen het product a p;

4) vind de som Sa. p=- 10 kg

5) bereken het rekenkundig gemiddelde met behulp van de momentenmethode:

M = EEN + ik Sap= 62 - 1×0,4 = 61,6 kg

We kunnen dus concluderen dat in de groep jonge mannen die we bestudeerden het gemiddelde lichaamsgewicht was

Het rekenkundig gemiddelde zegt op zichzelf niets over de variatiereeks waaruit

het werd berekend. De typiciteit (betrouwbaarheid) ervan wordt beïnvloed door de homogeniteit van het beschouwde

materiaal- en rijvariabiliteit.

Voorbeeld: er worden twee variatiereeksen met hetzelfde aantal waarnemingen gegeven, waarin

presenteert hoofdomtrekmetingen voor kinderen van 1 tot 2 jaar

Met hetzelfde aantal waarnemingen en dezelfde rekenkundige gemiddelden (M = 46 cm), is de reeks

hebben verschillen in de verdeling binnenin. Zo wijken de opties in de eerste rij doorgaans af

rekenkundig gemiddelde met een kleinere waarde dan de opties in de tweede rij, wat oplevert

mogelijkheid om aan te nemen dat het rekenkundig gemiddelde (46 cm) typischer is voor de eerste

rij dan voor de tweede.

In de statistieken gebruiken ze om de diversiteit van een variatiereeks te karakteriseren gemiddeld

standaardafwijking(S)

Er zijn twee manieren om de standaardafwijking te berekenen: rekenkundig gemiddelde

manier en manier van momenten. Bij de rekenmethode voor het rekenkundig gemiddelde wordt de formule gebruikt:

waarbij d de werkelijke afwijking is van elke optie van het werkelijke gemiddelde M. De formule wordt gebruikt wanneer

een klein aantal waarnemingen (n<30)

Formule voor het bepalen van s met behulp van de momentenmethode:

waarbij a de voorwaardelijke afwijking is van de opties van het voorwaardelijke gemiddelde;

Een moment van de tweede graad, en een moment van de eerste graad in het kwadraat.

Het is theoretisch en praktisch bewezen dat als er met een groot aantal waarnemingen sprake is van een gemiddelde

rekenkundig optellen en aftrekken van 1s (M ± 1s), en vervolgens binnen de grenzen van de verkregen waarden

68,3% van alle varianten van de variatiereeks wordt gevonden. Als naar het rekenkundig gemiddelde

optellen en aftrekken van 2s (M± 2s), dan zal 95,5% binnen de verkregen waarden liggen

alle optie. M ±3s omvat 99,7% van alle varianten van de variatiereeks.

Op basis van deze positie kunnen we de typiciteit van het rekenkundig gemiddelde controleren

variatiereeks waaruit het werd berekend. Om dit te doen moet je het gemiddelde nemen

tel de rekenkundige één op en trek er drievoudige s van af (M ± 3s). Indien binnen de ontvangen limieten

gegeven variatiereeksen passen, dan is het rekenkundig gemiddelde typisch, dat wil zeggen zij

geeft het basispatroon van de serie weer en kan worden gebruikt.

Deze bepaling wordt veel gebruikt bij de ontwikkeling van verschillende normen (kleding,

schoenen, schoolmeubilair, enz.).

Mate van diversiteit kenmerken in een variatiereeks kunnen worden beoordeeld door coëfficiënt

variaties(de verhouding van de standaardafwijking tot het rekenkundig gemiddelde,

vermenigvuldigd met 100%)

Met v= s x 100

Wanneer C v minder dan 10% is, wordt een zwakke diversiteit opgemerkt, wanneer C v 10-20% is - gemiddeld, en wanneer meer dan 20% -

sterke verscheidenheid aan eigenschappen.

Het beoordelen van de betrouwbaarheid van de resultaten van een statistisch onderzoek

Zoals we al hebben gezegd, kunnen de meest betrouwbare resultaten worden verkregen door gebruik te maken van

continue methode, d.w.z. bij het bestuderen van een algemene populatie.

Ondertussen gaat het onderzoek van een algemene bevolking gepaard met een aanzienlijke arbeidsintensiteit.

Daarom is biomedisch onderzoek in de regel selectief

observaties. Zodat de gegevens die zijn verkregen uit het bestuderen van de steekproefpopulatie kunnen zijn

werd overgedragen aan de algemene bevolking, is het noodzakelijk om de betrouwbaarheid te beoordelen

resultaten van statistisch onderzoek. De steekproefpopulatie is mogelijk niet voldoende

vertegenwoordigen de populatie volledig, dus het zijn altijd steekproefwaarnemingen

gaat gepaard met een representativiteitsfout. Op basis van de grootte van de gemiddelde fout (m) kan men oordelen

Hoeveel verschilt het gevonden steekproefgemiddelde van het algemene gemiddelde?

totaliteit. Een kleine fout geeft de nabijheid van deze indicatoren aan, een grote fout geeft aan

geeft geen vertrouwen.

De waarde van de gemiddelde fout van het rekenkundig gemiddelde wordt beïnvloed door de volgende twee omstandigheden.

Ten eerste de homogeniteit van het verzamelde materiaal: hoe minder verspreid de optie is

het gemiddelde, hoe kleiner de representativiteitsfout. Ten tweede het aantal observaties:

Hoe groter het aantal waarnemingen, hoe kleiner de gemiddelde fout zal zijn.

De gemiddelde fout van het rekenkundig gemiddelde wordt berekend met behulp van de volgende formule:

De gemiddelde fout (representativiteitsfout) voor relatieve waarden wordt bepaald door

formule:

waarbij mp de gemiddelde fout van de indicator is;

p - indicator in % of % o

q - (100 -r), (1000 -r)

n - totaal aantal waarnemingen

289 patiënten verlieten de medische instelling, 12 van hen stierven.

Relatieve waarde (sterftecijfer) p = (12:289)x100 = 4,1%; q=100 -ð =

100-4,1 =95,9, vanaf waar

mp = ±

De relatieve waarde tijdens herhaald onderzoek zal dus overeenkomen met

Vertrouw op grenzen- dit is de maximale en minimale waarde waarbinnen

voor een gegeven mate van waarschijnlijkheid van een foutloze voorspelling kan er een relatief zijn

indicator of gemiddelde waarde in de populatie

Vertrouwensgrenzen voor relatieve waarden in de populatie worden bepaald door

P-gen = P select ± tm m

De betrouwbaarheidsgrenzen van het rekenkundig gemiddelde in de populatie worden bepaald door de formule:

M gen = M select ± tm m

waarbij R gen en M gen de relatieve en gemiddelde waarden zijn die voor het algemeen zijn verkregen

totaliteit.

P-selectie en M-selectie - relatieve en gemiddelde waarden verkregen voor de steekproefpopulatie.

m р en m m - representativiteitsfout voor gemiddelde en relatieve waarden.

t - betrouwbaarheidscriterium.

Er is vastgesteld dat als t= 1 de betrouwbaarheid niet groter is dan 68%; als t=2 -95%; als t=3- 99%

In medisch en biologisch onderzoek wordt het als criterium voldoende geacht

betrouwbaarheid t³ 2 (95% betrouwbaarheid)

Om voor een aantal waarnemingen € 30,- het t-criterium te vinden, moet je een special gebruiken

tafel

Naarmate de omvang van de representativiteitsfout afneemt, nemen de betrouwbaarheidsgrenzen af

gemiddelde en relatieve waarden, d.w.z. de onderzoeksresultaten zijn verduidelijkt en naderen

overeenkomend met de waarden van de algemene bevolking. Als de representativiteitsfout

groot is, dan krijgen we grote betrouwbaarheidsgrenzen, die mogelijk in tegenspraak zijn

logische beoordeling van de gewenste waarde in de algemene bevolking. Vertrouw op grenzen

hangt ook af van de door de onderzoeker gekozen mate van waarschijnlijkheid van een foutloze voorspelling. Bij

hoge mate van waarschijnlijkheid van foutloze voorspellingsbereiken van betrouwbaarheidslimieten



Vond je het artikel leuk? Deel het
Bovenkant