La regressione lineare è quella tecnica statistica utilizzata per studiare la relazione che intercorre tra due o più variabili, di cui una è dipendente dall’altra (o dalle altre), quando tra esse vi è un legame lineare.
Strettamente legata alla regressione infatti, è il concetto di correlazione, ovvero una relazione tra due variabili tale che a ciascun valore della prima corrisponda un valore della seconda, seguendo una certa regolarità.
nella teoria della regressione (semplice) si suppone che una variabile X assume valori determinati e si cerca la relazione che lega la seconda variabile Y alla prima: in altre parole si cerca di stabilire un legame funzionale tra le due variabili

Il coefficiente β0 è detto intercetta e rappresenta il valore della variabile Y quando X=0; mentre β1 è chiamato coefficiente angolare o coefficiente di regressione o, ancora, pendenza della retta e rappresenta la variazione subita in media dal carattere Y per effetto di un aumento unitario del carattere X.
La retta è stata trovata con il metodo dei minimi quadrati, ovvero è tale che la somma delle distanze tra le y teoriche e le y osservate al quadrato sia minima.
Inoltre è dimostrato che il coefficiente β1 risulta essere pari al rapporto tra la covarianza di X e Y e la varianza di X, mentre il coefficiente β0 risulta essere pari alla differenza tra la media delle y osservate e il prodotto tra β1 e la media delle x osservate
