Kako zagnati regresijo v Excelu

Kazalo:

Kako zagnati regresijo v Excelu
Kako zagnati regresijo v Excelu
Anonim

Regresija v Excelu je način za avtomatizacijo statističnega postopka primerjave več nizov informacij, da bi videli, kako spremembe neodvisnih spremenljivk vplivajo na spremembe odvisnih spremenljivk. Če ste kdaj želeli najti korelacijo med dvema stvarema, je uporaba regresijske analize v Excelu eden najboljših načinov za to.

Navodila v tem članku veljajo za Excel 2019, Excel 2016, Excel 2013, Excel 2010.

Kaj je pomen regresije?

Regresija je pristop statističnega modeliranja, ki ga analitiki uporabljajo za določanje odnosov med več spremenljivkami.

Regresijska analiza se začne z eno samo spremenljivko, ki jo poskušate analizirati, in neodvisnimi spremenljivkami, ki jih testirate, da vidite, ali vplivajo na to posamezno spremenljivko. Analiza obravnava spremembe v neodvisnih spremenljivkah in poskuša te spremembe povezati s posledičnimi spremembami v posamezni (odvisni) spremenljivki.

Morda se to sliši kot napredna statistika, vendar Excel omogoča to zapleteno analizo vsem.

Izvajanje linearne regresije v Excelu

Najenostavnejša oblika regresijske analize je linearna regresija. Preprosta linearna regresija obravnava razmerje med samo dvema spremenljivkama.

Naslednja preglednica na primer prikazuje podatke, ki vsebujejo število kalorij, ki jih je oseba zaužila vsak dan, in njihovo težo na ta dan.

Image
Image

Ker ta preglednica vsebuje dva stolpca podatkov in bi lahko ena spremenljivka potencialno vplivala na drugo, lahko zaženete regresijsko analizo teh podatkov z uporabo Excela.

Omogočanje dodatka Analysis ToolPak

Preden lahko uporabite Excelovo funkcijo regresijske analize, morate omogočiti dodatek Analysis ToolPak na zaslonu z možnostmi programa Excel.

  1. V Excelu izberite meni Datoteka in izberite Možnosti.

    Image
    Image
  2. Izberite Dodatki v levem navigacijskem meniju. Nato se prepričajte, da je Excel Add-ins izbran v polju Manage.

    Image
    Image
  3. Na koncu izberite gumb Pojdi.

    Image
    Image
  4. V pojavnem oknu Dodatki. Omogočite Analysis ToolPack tako, da kliknete polje pred njim, da dodate kljukico in izberete OK.

    Image
    Image

Zdaj, ko je Analysis ToolPak omogočen, ste pripravljeni začeti izvajati regresijsko analizo v Excelu.

Kako izvesti preprosto linearno regresijo v Excelu

Na primeru preglednice s težo in kalorijami lahko izvedete linearno regresijsko analizo v Excelu, kot sledi.

  1. Izberite meni Podatki. Nato v skupini Analiza izberite Analiza podatkov.

    Image
    Image
  2. V oknu Analiza podatkov s seznama izberite Regression in kliknite OK.

    Image
    Image
  3. Vhodni obseg Y je obseg celic, ki vsebuje odvisno spremenljivko. V tem primeru je to teža. Input X Range je obseg celic, ki vsebuje neodvisno spremenljivko. V tem primeru je to stolpec s kalorijami.

    Image
    Image
  4. Izberite Labels za celice glave in nato izberite Nov delovni list, da pošljete rezultate na nov delovni list. Izberite OK, da Excel izvede analizo in pošlje rezultate na nov list.

    Image
    Image
  5. Preglejte nov delovni list. Izhod analize ima številne vrednosti, ki jih morate razumeti za razlago rezultatov.

    Image
    Image

    Vsaka od teh številk ima naslednje pomene:

    • Multiple R: korelacijski koeficient. 1 označuje močno korelacijo med dvema spremenljivkama, medtem ko -1 pomeni, da obstaja močno negativno razmerje. 0 pomeni, da ni korelacije.
    • R Square: Determinacijski koeficient, ki kaže, koliko točk med dvema spremenljivkama pade na regresijsko premico. Statistično gledano je to vsota kvadratov odstopanj od povprečja.
    • Prilagojeni kvadrat R: statistična vrednost, imenovana kvadrat R, ki je prilagojena za število neodvisnih spremenljivk, ki ste jih izbrali.
    • Standardna napaka: Kako natančni so rezultati regresijske analize. Če je ta napaka majhna, so rezultati vaše regresije natančnejši.
    • Opazovanja: Število opazovanj v vašem regresijskem modelu.

    Preostale vrednosti v izhodu regresije vam dajejo podrobnosti o manjših komponentah v regresijski analizi.

    • df: Statistična vrednost, znana kot prostostne stopnje, povezane z viri variance.
    • SS: Vsota kvadratov. Razmerje med rezidualno vsoto kvadratov in skupnim SS bi moralo biti manjše, če večina vaših podatkov ustreza regresijski črti.
    • MS: srednji kvadrat regresijskih podatkov.
    • F: F statistika (F-test) za ničelno hipotezo. To zagotavlja pomen regresijskega modela.
    • Pomen F: Statistična vrednost, znana kot P-vrednost F.

    Če ne razumete statistike in izračunavanja regresijskih modelov, vrednosti na dnu povzetka ne bodo imele veliko pomena. Vendar pa sta kvadrat R in R dva najpomembnejša.

Kot lahko vidite, so v tem primeru kalorije močno povezane s skupno težo.

Večkratna linearna regresijska analiza v Excelu

Če želite izvesti isto linearno regresijo, vendar z več neodvisnimi spremenljivkami, izberite celoten obseg (več stolpcev in vrstic) za Vhodni obseg X.

Image
Image

Ko izbirate več neodvisnih spremenljivk, je manj verjetno, da boste našli tako močno korelacijo, ker je spremenljivk toliko.

Vendar vam lahko regresijska analiza v Excelu pomaga najti korelacije z eno ali več spremenljivkami, za katere se morda ne zavedate, da obstajajo, samo z ročnim pregledovanjem podatkov.

Priporočena: