În statistică Regresia este un proces statistic ce estimează relațiile între variabile. Modelele de regresie implică următorii termeni:
Ecuația Y = f (x ) este transformată în numere și ne permite să găsim nivelul necesar a lui x în expresie pentru un Y dat.
În acest fel la schimbările cerute de client pentru un alt Y, noua valoare a variabilei x poate fi identificată rapid astfel încât să se obțină noile cerințe.
Regresia ne ajută să înțelegem modul în care valoarea variabilei dependente se schimbă atunci când oricare dintre variabilele independente variază, în timp ce celelalte variabile independente rămânând nemodificate.
Cel mai răspândit tip de regresie este regresia liniară. Regresia liniară este o aprecierea unui model de relație dintre o variabilă dependentă Y și o variabilă independentă notată x.
În exemplul alăturat (vezi grafic) dorim să vedem dacă există o influență a mărimii populației „Population” (numărului de locuitori) asupra volumului de vânzări „Sales”. MINITAB face pentru noi analiza și ne oferă toate informațiile dorite, inclusiv ecuația Y = f (x ).
Putem în acest fel să calculăm și care sunt vânzărle așteptate pentru o anume populație și putem afla și cît de bine se potrivește ecuația cu realitatea – prin R-sq [%]. Cu cât R-sq este mai spre 100% cu atât modelul este mai aproape de perfecțiune.
Regresia liniară are o limitare în ceea ce privește tratarea intrărilor (x). Ea poate considera relația doar cu câte una din variabile. În situațiile reale însă, de cele mai multe ori procesele pot fi modelate doar ținând cont de mai multe variabile: Y=f(x1+x2+…..+xn). În această situație putem folosi regresia multiplă.
Analiza folosing regresia multiplă este o tehnică puternică utilizată pentru estimarea valorii necunoscute a unei variabile din valoarile cunoscută a două sau mai multe variabile - numite de asemenea predictori.
Termenul de regresie multiplă a fost folosit pentru prima dată de către Pearson în 1908. Ecuația de regresie multiplă cu mai mulți termeni are forma următoare:
Y = b0 + b1x1 + b2x2 + ... + bkxk
În ecuație, literele reprezintă următoarele: