Regressione lineare
In statistica , la regressione lineare è un approccio lineare per modellare la relazione tra variabile dipendente e una o più variabili indipendenti . Il caso di una variabile esplicativa si chiama regressione lineare semplice invece nel caso di più variabile esplicative, il processo è chiamato regressione lineare multipla .Prendendo in considerazione due variabili
In generale si indica la retta di regressione nel seguente modo:
X
e Y
osservate sulle stesse unità di un campione, lo scopo della regressione lineare è determinare la retta che minimizza le distanze tra i valori teorici della retta con i valori realmente osservati.Il grafico seguente è una semplice rappresentazione della retta.In generale si indica la retta di regressione nel seguente modo:
Per trovare la retta di regressione bisogna minimizzare la distanza tra i valori realmente osservati y e i valori teorici y*
Ora derivo l'equazione precedente per α e per β e eguaglio i risultati a zero e li pongo a sistema:
Per semplificare il risultato faccio alcune sostituzioni :
Sviluppando il sistema con alcuni semplici passaggi algebrici si arriva al seguente risultato:
Una prima proprietà di questa retta è che passa per il baricentro dei dati, una seconda proprietà è che la media dei valori teorici coincide con la media dei valori realmente osservati , questa proprietà si può dimostrare con dei semplici calcoli:
Infine un altra proprietà è che la correlazione lineare tra la variabile
X
e i residui del modello è nulla.
Commenti
Posta un commento