Xlera8

Înțelegerea interceptelor de regresie liniară în limbaj simplu – DATAVERSITY

Sunt adesea întrebat despre rolul interceptelor în modelele de regresie liniară – în special interceptele negative. Iată postarea mea de blog pe acest subiect în cuvinte simple, cu termeni statistici minimi.  

Modelele de regresie sunt folosite pentru a face predicții. The coeficienții din ecuație definiți relația dintre fiecare variabilă independentă și variabila dependentă. Intercepta sau constanta din modelul de regresie reprezintă valoarea medie a variabilei răspuns atunci când toate variabilele predictoare din model sunt egale cu zero. În regresia liniară, interceptarea este valoarea variabilei dependente, adică Y când toate valorile sunt variabile independente, iar Xs sunt zero. Dacă X este uneori egal cu 0, interceptarea este pur și simplu valoarea așteptată a lui Y la acea valoare. Din punct de vedere matematic și grafic, un model de regresie liniară simplă (SLR) este prezentat mai jos.

Dar care este interpretarea comercială a interceptării în modelul de regresie? În termeni de afaceri, o interceptare reprezintă o linie de bază sau un punct de plecare pentru variabila dependentă, dacă variabilele independente sunt setate la zero. Interceptarea servește ca punct de plecare pentru evaluarea efectelor variabilelor independente asupra variabilei dependente. Acesta reflectă porțiunea variabilei dependente care nu este influențată de variabilele independente incluse în model. Ajută la cuantificarea impactului modificărilor variabilelor independente de la această valoare de referință. De exemplu, într-un model de predicție a vânzărilor, interceptarea poate reprezenta vânzările așteptate atunci când toate eforturile de marketing, adică predictorii sunt la zero. În finanțe, interceptarea poate reprezenta costuri fixe sau generale care sunt suportate indiferent de nivelul de activitate sau de alți factori. 

Din punct de vedere tehnic, interceptarea în modelul de regresie liniară poate fi pozitivă, negativă sau chiar zero.

  1. Interceptare pozitivă: Dacă interceptarea în modelul de regresie este pozitivă, înseamnă că valoarea prezisă a variabilei dependente (Y) atunci când variabila independentă (X) este zero este pozitivă. Aceasta implică faptul că linia de regresie traversează axa y deasupra valorii zero.
  2. Interceptare negativă: În schimb, dacă intercepta într-un model de regresie liniară este negativă, înseamnă că valoarea prezisă a lui Y atunci când X este zero este negativă. În acest caz, linia de regresie traversează axa y sub valoarea zero.
  3. Zero Intercept: Dacă interceptul într-un model de regresie este zero, înseamnă că linia de regresie trece prin originea (0,0) pe grafic. Aceasta înseamnă că valoarea prezisă a variabilei dependente este zero atunci când toate variabilele independente sunt, de asemenea, zero. Cu alte cuvinte, nu există un termen constant suplimentar în ecuația de regresie. Această situație este extrem de rată și foarte teoretică.

Practic, ai de-a face cu interceptările negative sau pozitive, iar atunci când dai peste interceptarea negativă, te ocupi de interceptarea negativă la fel cum ai face cu o interceptare pozitivă. Dar, în termeni practici, o interceptare negativă poate avea sens sau nu, în funcție de contextul datelor analizate. De exemplu, dacă analizați temperatura zilei (X) și vânzările de înghețată (Y), o interceptare negativă nu ar fi semnificativă, deoarece este imposibil să aveți vânzări negative. Cu toate acestea, în alte domenii, cum ar fi analiza financiară, o interceptare negativă ar putea avea sens.

Mai jos sunt câteva abordări pe care le puteți lua în considerare atunci când aveți interceptări negative:

  1. Verificați erorile de date și ipotezele: înainte de a face orice ajustări, asigurați-vă că sunt îndeplinite ipotezele de regresie. Aceasta include liniaritatea, independența, homoscedasticitatea (referitor la reziduuri), normalitatea variabilelor și reziduurilor de date, valori aberante și multe altele. Dacă aceste ipoteze sunt încălcate, este necesar să le abordați mai întâi.
  2. Aplicați perspicacitatea afacerilor și bunul simț și verificați dacă interpretarea interceptării negative are sens practic. O interceptare negativă ar putea avea sens în funcție de ceea ce reprezintă interceptarea. De exemplu, în datele financiare, o interceptare negativă ar putea indica un punct de plecare sub zero, ceea ce poate fi perfect rezonabil. Dar dacă analizați date despre temperatura și vânzările de înghețată, o interceptare negativă nu ar fi semnificativă, deoarece este imposibil să aveți vânzări negative.
  3. Centrați variabilele. Modelele de regresie sunt valabile numai pentru un interval dat de valori ale datelor. Dar uneori, valorile variabilelor independente și dependente pot fi în afara intervalului dat. În acest sens, centrarea presupune scăderea unei valori constante sau a mediei aritmetice a unei variabile (independenți) din fiecare dintre valorile acesteia. Acest lucru poate facilita interpretarea, mai ales dacă variabilele independente (Xs) au valori zero. Practic, prin centrarea variabilelor în jurul mediilor lor, interceptul reprezintă valoarea prezisă a variabilei dependente atunci când variabilele independente sunt la valorile lor medii. De asemenea, în unele cazuri, valorile extreme sau valorile aberante ale datelor pot duce la instabilitate numerică în modelele de regresie. Centrarea variabilelor poate atenua aceste probleme prin reducerea dimensiunii variabilelor și făcând modelul de regresie mai stabil.
  4. Asigurați-vă că variabilele de confuzie sunt în modelul de regresie. Adăugarea de variabile explicative suplimentare sau variabile de confuzie la modelul de regresie poate ajuta la explicarea interceptării negative.

În general, este important de reținut că modelele de regresie liniară se bazează pe ipoteze. În primul rând, ei presupun o relație liniară între variabile, care poate să nu fie întotdeauna adevărată în scenariile din lumea reală. În plus, regresia liniară depinde de datele distribuite în mod normal și este foarte sensibilă la valori aberante. Nu în ultimul rând, regresia liniară poate să nu funcționeze bine cu relațiile neliniare și, în astfel de cazuri, modele mai complexe, cum ar fi regresia polinomială sau regresia neliniară, pot fi mai potrivite.

Referinţă

Chat cu noi

Bună! Cu ce ​​​​vă pot ajuta?