Wat is variantie?
We gebruiken de variantie van gegevens om het bereik van toekomstige waarde in serie te schatten. De variantie geeft aan hoeveel gegevens kunnen afwijken van de gemeen van de dataset. Variantie wordt vaak de foutwaarde genoemd. Het is niet de meest vertrouwde statistiek en we gebruiken het niet alleen om toekomstige waarde te voorspellen.
Als wiskundig gesproken, is variantie een gemiddelde van het gekwadrateerde verschil van gegevenspunten van het gemiddelde van de gegevens. Variantie is de kwadratische waarde van de standaarddeviatie. Hieronder staan de twee variantieformules.
We hoeven deze formules niet te gebruiken om de variantie in Excel te berekenen. Excel heeft hiervoor twee formules VAR.P en VAR.S. Als u alleen wilt weten hoe u de variantie in Excel kunt berekenen, gebruikt u de formules zoals hieronder beschreven. Als je wilt weten wat variantie is en wanneer je welke variantieformule moet gebruiken, lees dan het hele artikel.
Hoe variantie in Excel te vinden?
Laten we een voorbeeld nemen.
Ik heb mijn website in januari 2019 gelanceerd. Hier heb ik elke maand gegevens van nieuwe gebruikers die op mijn website zijn aangemeld. Ik wil de variantie van deze gegevens weten.
Dit zijn volledige gegevens. Wanneer we volledige gegevens (hele populatie) vastleggen, berekenen we de variantie van de populatie (waarom? Ik zal het later in het artikel uitleggen). De Excel-functie voor het berekenen van de variantie van de populatie is VAR.P. De syntaxis van VAR.P is
=VAR.P(getal1,[getal2],… )
Nummer1, nummer2,… : dit zijn de getallen waarvan je de variantie wilt berekenen.
Het eerste nummer is verplicht.
Laten we deze formule gebruiken om de variantie van onze gegevens te berekenen. We hebben gegevens in cel C2:C15. De formule wordt dus:
=VAR.P(C2:C15) |
Dit retourneert een waarde 186.4285714, wat een vrij grote variantie is gezien onze gegevens.
Sinds mijn website in januari 2019 is gelanceerd, heb ik alle gegevens. Ervan uitgaande dat ik mijn website lang geleden heb gelanceerd, maar de gegevens die ik heb zijn alleen van januari 2019 tot februari 2020. Ik heb geen volledige gegevens. Het zijn dan slechts voorbeeldgegevens. In dat geval gebruik ik VAR.P niet, maar gebruik ik de VAR.S-functie om de variantie te berekenen.
=VAR.S(C2:C15) |
De functie VAR.S retourneert een grotere variantie dan VAR.P. Het retourneert 200.7692308.
Hoe variantie handmatig wordt berekend in Excel?
Dus ja, zo bereken je variantie in Excel. Maar hoe berekenen deze variantiefuncties deze getallen? Als je het weet, kun je deze cijfers beter begrijpen en verstandig gebruiken. Anders zijn deze getallen slechts willekeurige getallen. Om het te begrijpen, moeten we de variantie handmatig berekenen.
Bereken de variantie van de bevolking handmatig in Excel
We zullen dezelfde gegevens gebruiken die we in het bovenstaande voorbeeld hebben gebruikt. De wiskundige formule voor Bevolkingsvariantie is:
Om de variantie te berekenen, moeten we het gemiddelde (GEMIDDELDE) van de gegevens berekenen, het verschil van elke waarde van het gemiddelde, ze optellen en tenslotte die som delen door het totale aantal waarnemingen.
Stap 1. Bereken gemiddelde van gegevens
Om het gemiddelde van gegevens in Excel te berekenen, gebruiken we de functie GEMIDDELDE.
Gebruik deze formule in cel C17 (of waar u maar wilt).
=GEMIDDELDE(C2:C15) |
Dit geeft 233.0 terug.
Stap 2: Zoek het verschil tussen elk gegevenspunt en het gemiddelde
Ga nu naar cel D2 en trek het gemiddelde (C17) af van C2 (x). Gebruik deze formule in D2 en sleep deze naar D15.
=C2-$C$17 |
Stap 3: Squire elk verschil.
Nu moeten we elk verschil dat we hier hebben kwadrateren. Schrijf in cel E2 de onderstaande formule en sleep naar beneden naar E15:
=VERMOGEN(D2,2) |
Stap 4: tel de vierkanten bij elkaar op
Nu moeten we deze gekwadrateerde verschillen optellen. Gebruik dus deze formule in cel C18:
=SOM(E2:E13) |
Laatste stap: deel de som van kwadraten door het aantal waarnemingen.
Ik heb 14 observaties. U kunt desgewenst berekenen met behulp van de COUNT-functie.
Gebruik deze formule in cel C19 om de variantie van de populatie te berekenen.
=C18/COUNT(C2:C15) |
Dit retourneert de waarde 186.429… die exact hetzelfde is als de variantie die wordt geretourneerd door de Excel-variantieformule VAR.P hierboven.
Nu u weet hoe de variantie van de populatie handmatig wordt berekend in Excel, kunt u weten hoe u deze in de daadwerkelijke analyse kunt gebruiken.
Bereken de variantie van het monster handmatig in Excel
In de meeste gevallen is het onmogelijk om alle gegevens vast te leggen voor analyse. We kiezen meestal een willekeurige steekproef uit de gegevens en analyseren deze om de aard van de gegevens te interpreteren. In dat geval kunnen we, als we de variantie van de populatie gebruiken, een destructieve analyse zijn. Voor de zekerheid gebruiken we de Variance of Sample-formule. De formule voor de variantie van steekproef is:
Het enige verschil in steekproef- en populatievariantie is de noemer. Bij steekproefvariantie trekken we één af van het aantal waarnemingen (n-1). Dit wordt onpartijdige analyse genoemd. Dit zorgt ervoor dat de gegevens niet worden onderschat en het mogelijke foutenbereik iets groter is.
Om de variantie van de steekproef handmatig in Excel te berekenen, moeten we stap 1 tot 4 van de variantie van de populatie herhalen. Gebruik in de laatste stap de onderstaande formule:
=C18/(COUNT(C2:C15)-1) |
Dit geeft 200.769 terug. Dit is precies hetzelfde als de variantie die wordt geretourneerd door de functie VAR.S. Er is een groter foutenbereik nodig dan VAR.P om minder kans op fouten bij de voorspelling te garanderen.
De variantie van gegevens is niet zo vertrouwd voor voorspelling. We berekenen de standaarddeviatie, de vierkantswortel van variantie, en vele andere statistieken om de kans op fouten bij de voorspelling te minimaliseren.
Dus ja jongens, dit is hoe je de variantie in Excel kunt berekenen. Ik hoop dat het verhelderend en nuttig was. Als je twijfels hebt over deze variantie in Excel of andere statistieken, is het commentaargedeelte helemaal van jou.
Hoe de standaarddeviatie in Excel te berekenen : Om de standaarddeviatie te berekenen hebben we meerdere formules. De standaarddeviatie is gewoon de vierkantswortel van de variantie. Het vertelt meer over de data dan over de variantie.
Hoe de VAR.P-functie in Excel te gebruiken? : Bereken de variantie voor de populatiegegevens in Excel met behulp van de VAR.P-functie
Hoe de STDEV.P-functie in Excel te gebruiken? : Bereken de standaarddeviatie voor de populatiegegevens in Excel met behulp van de VAR.P-functie
Hoe de DSTDEVP-functie in Excel te gebruiken? : Bereken de standaarddeviatie voor de steekproefgegevensnummers met meerdere criteria in Excel met behulp van de DSTDEVP-functie
Hoe de VAR-functie in Excel te gebruiken? : Bereken de variantie voor de voorbeeldgegevensnummers in Excel met behulp van de VAR-functie.
Regressieanalyse in Excel: Regressie is een Analyse Tool, die we gebruiken voor het analyseren van grote hoeveelheden data en het maken van prognoses en voorspellingen in Microsoft Excel.
Een standaarddeviatiegrafiek maken : De standaarddeviatie geeft aan hoeveel de gegevens zijn geclusterd rond het gemiddelde van de gegevens.
Populaire artikels:
50 Excel-snelkoppelingen om uw productiviteit te verhogen | Word sneller in uw taak. Met deze 50 sneltoetsen werk je nog sneller in Excel.
De VERT.ZOEKEN-functie in Excel | Dit is een van de meest gebruikte en populaire functies van Excel die wordt gebruikt om waarde op te zoeken uit verschillende bereiken en bladen.
AANTAL.ALS in Excel 2016 | Tel waarden met voorwaarden met behulp van deze geweldige functie. U hoeft uw gegevens niet te filteren om specifieke waarden te tellen. Countif-functie is essentieel om uw dashboard voor te bereiden.
Hoe de SUMIF-functie in Excel te gebruiken? | Dit is een andere essentiële functie van het dashboard. Dit helpt u bij het optellen van waarden voor specifieke voorwaarden.