Kako narediti test T v Excelu

Kazalo:

Kako narediti test T v Excelu
Kako narediti test T v Excelu
Anonim

T-test je način odločanja, ali obstajajo statistično pomembne razlike med nizi podatkov, z uporabo Studentove t-distribucije. T-test v Excelu je dvovzorčni T-test, ki primerja povprečja dveh vzorcev. Ta članek pojasnjuje, kaj pomeni statistična pomembnost, in prikazuje, kako narediti T-test v Excelu.

Navodila v tem članku veljajo za Excel 2019, 2016, 2013, 2010, 2007; Excel za Microsoft 365 in Excel Online.

Image
Image

Kaj je statistična pomembnost?

Predstavljajte si, da želite vedeti, katera od dveh kock bo dala boljši rezultat. Vržete prvo kocko in dobite 2; vržeš drugo kocko in dobiš 6. Ali vam to pove, da druga kocka običajno daje višje rezultate? Če ste odgovorili "Seveda ne," potem že imate nekaj razumevanja statistične pomembnosti. Razumete, da je razlika nastala zaradi naključne spremembe rezultata ob vsakem metu kocke. Ker je bil vzorec zelo majhen (samo en zvitek), ni pokazal nič pomembnega.

Zdaj si predstavljajte, da vsako kocko vržete 6-krat:

  • Prva kocka vrže 3, 6, 6, 4, 3, 3; Srednja vrednost=4,17
  • Druga kocka vrže 5, 6, 2, 5, 2, 4; Srednja vrednost=4,00

Ali to zdaj dokazuje, da prva kocka daje višje rezultate kot druga? Verjetno ne. Majhen vzorec z relativno majhno razliko med srednjimi vrednostmi kaže, da je razlika še vedno posledica naključnih variacij. Ko povečujemo število metov kock, postane težko podati zdravorazumski odgovor na vprašanje - ali je razlika med rezultati rezultat naključne variacije ali je dejansko bolj verjetno, da bo eden dal višje rezultate kot drugi?

Pomembnost je verjetnost, da je opažena razlika med vzorci posledica naključnih variacij. Pomembnost se pogosto imenuje raven alfa ali preprosto "α". Raven zaupanja ali preprosto 'c' je verjetnost, da razlika med vzorci ni posledica naključne variacije; z drugimi besedami, da obstaja razlika med osnovnimi populacijami. Zato: c=1 – α

Lahko nastavimo 'α' na poljubno raven, da smo prepričani, da smo dokazali pomembnost. Zelo pogosto se uporablja α=5 % (95-odstotno zaupanje), če pa želimo biti resnično prepričani, da kakršnih koli razlik ni povzročila naključna variacija, lahko uporabimo višjo stopnjo zaupanja z uporabo α=1 % ali celo α=0,1. %.

Za izračun pomembnosti v različnih situacijah se uporabljajo različni statistični testi. T-testi se uporabljajo za ugotavljanje, ali so srednje vrednosti dveh populacij različni, F-testi pa se uporabljajo za ugotavljanje, ali so variance različne.

Zakaj testirati statistično pomembnost?

Ko primerjamo različne stvari, moramo uporabiti testiranje pomembnosti, da ugotovimo, ali je ena boljša od druge. To velja za številna polja, na primer:

  • V poslu morajo ljudje primerjati različne izdelke in metode trženja.
  • V športu morajo ljudje primerjati različno opremo, tehnike in tekmovalce.
  • V inženirstvu morajo ljudje primerjati različne zasnove in nastavitve parametrov.

Če želite preizkusiti, ali je nekaj na katerem koli področju boljše od nečesa drugega, morate preizkusiti statistično pomembnost.

Kaj je študentova T-distribucija?

Studentova t-porazdelitev je podobna normalni (ali Gaussovi) porazdelitvi. Obe sta zvonasti porazdelitvi z večino rezultatov blizu povprečja, nekateri redki dogodki pa so precej daleč od povprečja v obe smeri, kar imenujemo repi porazdelitve.

Natančna oblika Studentove t-porazdelitve je odvisna od velikosti vzorca. Za vzorce z več kot 30 je zelo podobna običajni porazdelitvi. Ko se velikost vzorca zmanjša, se repi povečajo, kar predstavlja večjo negotovost, ki izhaja iz sklepanja na podlagi majhnega vzorca.

Kako narediti T-test v Excelu

Preden lahko uporabite T-test za ugotavljanje, ali obstaja statistično značilna razlika med sredinama dveh vzorcev, morate najprej izvesti F-test. To je zato, ker se za T-test izvajajo različni izračuni glede na to, ali obstaja pomembna razlika med variancami.

Za izvedbo te analize boste potrebovali dodatek Analysis Toolpak omogočen.

Preverjanje in nalaganje dodatka Analysis Toolpak

Če želite preveriti in aktivirati Analysis Toolpak, sledite tem korakom:

  1. Izberite zavihek DATOTEKA >izberite Možnosti.
  2. V pogovornem oknu Možnosti izberite Add-Ins med zavihki na levi strani.
  3. Na dnu okna izberite spustni meni Upravljanje, nato izberite Excel Add-ins. Izberite Pojdi.

    Image
    Image
  4. Prepričajte se, da je potrjeno potrditveno polje zraven Analysis Toolpak, nato izberite OK.
  5. Paket orodij za analizo je zdaj aktiven in pripravljeni ste na uporabo F-testov in T-testov.

Izvajanje F-testa in T-testa v Excelu

  1. Vnesite dva niza podatkov v preglednico. V tem primeru upoštevamo prodajo dveh izdelkov v enem tednu. Izračunana je tudi povprečna dnevna vrednost prodaje za vsak izdelek skupaj z njegovim standardnim odklonom.

    Image
    Image
  2. Izberite zavihek Podatki > Analiza podatkov

    Image
    Image
  3. Iz seznama izberite F-Test Two-Sample for Variances, nato izberite OK.

    Image
    Image

    F-test je zelo občutljiv na nenormalnosti. Zato je morda varneje uporabiti Welchov test, vendar je to v Excelu težje.

  4. Izberite obseg spremenljivke 1 in obseg spremenljivke 2; nastavite Alpha (0,05 daje 95-odstotno zaupanje); izberite celico za zgornji levi kot izpisa, saj bo to zapolnilo 3 stolpce in 10 vrstic. Izberite OK.

    Image
    Image

    Za obseg za spremenljivko 1 mora biti izbran vzorec z največjim standardnim odklonom (ali varianco).

  5. Oglejte si rezultate F-testa, da ugotovite, ali obstaja pomembna razlika med variancami. Rezultati dajejo tri pomembne vrednosti:

    • F: Razmerje med variancami.
    • P(F<=f) one-tail: verjetnost, da spremenljivka 1 dejansko nima večje variance kot spremenljivka 2. Če je ta večja od alfe, ki na splošno 0,05, potem med variancami ni bistvene razlike.
    • F Kritični one-tail: vrednost F, ki bi bila zahtevana za P(F<=f)=α. Če je ta vrednost večja od F, to tudi pomeni, da med variancami ni bistvene razlike.

    P(F<=f) je mogoče izračunati tudi s funkcijo FDIST s F in prostostnimi stopnjami za vsak vzorec kot vhodnimi podatki. Stopnje svobode so preprosto število opazovanj v vzorcu minus ena.

  6. Zdaj, ko veste, ali obstaja razlika med variancami, lahko izberete ustrezen T-test. Izberite zavihek Podatki > Analiza podatkov, nato izberite t-test: dvovzorčni predpostavki enakih variancali t-test: dvovzorčni predpostavki neenakih varianc

    Image
    Image
  7. Ne glede na to, katero možnost ste izbrali v prejšnjem koraku, se vam prikaže isto pogovorno okno za vnos podrobnosti analize. Za začetek izberite obsege, ki vsebujejo vzorce za Razpon spremenljivke 1 in Razpon spremenljivke 2.

    Image
    Image
  8. Ob predpostavki, da želite preveriti, ali med povprečji ni razlike, nastavite Hipotetično srednjo razliko na nič.
  9. Nastavite raven pomembnosti alfa (0,05 daje 95-odstotno zaupanje) in izberite celico za zgornji levi kot izpisa, ob upoštevanju, da bo to zapolnilo 3 stolpce in 14 vrstic. Izberite OK.
  10. Preglejte rezultate, da se odločite, ali obstaja pomembna razlika med srednjimi vrednostmi.

    Tako kot pri F-testu, če je p-vrednost, v tem primeru P(T<=t), večja od alfa, potem ni pomembne razlike. Vendar sta v tem primeru podani dve vrednosti p, ena za enorepi test in druga za dvorepi test. V tem primeru uporabite vrednost z dvema repoma, saj bi bila katera koli spremenljivka z večjo srednjo vrednostjo pomembna razlika.

Priporočena: