Regressione lineare

In statistica , la regressione lineare è un approccio lineare per modellare la relazione tra variabile dipendente  e una o più variabili indipendenti . Il caso di una variabile esplicativa si chiama regressione lineare semplice  invece nel caso di più variabile esplicative, il processo è chiamato regressione lineare multipla .Prendendo in considerazione  due variabili X e Y osservate sulle stesse unità di un campione, lo scopo della regressione lineare è determinare la retta che minimizza le distanze tra i valori teorici della retta con i valori realmente osservati.Il grafico seguente è una semplice rappresentazione della retta.

 In generale si indica la retta di regressione nel seguente modo:


Per trovare la retta di regressione bisogna minimizzare la distanza tra i valori realmente osservati y e i valori teorici y*

Ora derivo l'equazione precedente per α e per β e eguaglio i risultati a zero  e li pongo a sistema:
Per semplificare il risultato faccio alcune sostituzioni :
Sviluppando il sistema con alcuni semplici passaggi algebrici si arriva  al seguente risultato:
Una prima proprietà di questa retta è che passa per il baricentro dei dati, una seconda proprietà è che la media dei valori teorici coincide con la media dei valori realmente osservati , questa proprietà si può dimostrare con dei semplici calcoli:


Infine un altra proprietà è che la correlazione lineare tra la variabile X e i residui del modello è nulla.

Commenti

Post popolari in questo blog

Relazioni di ricorrenza per la covarianza

La formula di Legendre e la sua utilità nelle applicazioni