Xlera8

A lineáris regressziós lefogások megértése egyszerű nyelven – DATAVERSITY

Gyakran kérdeznek tőlem a metszéspontok szerepéről a lineáris regressziós modellekben – különösen a negatív metszetekben. Íme a blogbejegyzésem a témában egyszerű szavakkal, minimális statisztikai kifejezésekkel.  

A regressziós modelleket előrejelzések készítésére használják. A együtthatók az egyenletben definiálja az egyes független változók és a függő változók közötti kapcsolatot. A regressziós modellben a metszéspont vagy konstans a válaszváltozó átlagértékét jelenti, ha a modellben szereplő összes prediktorváltozó nulla. A lineáris regresszióban a metszéspont a függő változó értéke, azaz Y, ha minden érték független változó, Xs pedig nulla. Ha X néha 0, akkor a metszéspont egyszerűen Y várható értéke ezen az értéken. Matematikailag és képileg az alábbiakban egy egyszerű lineáris regressziós (SLR) modellt mutatunk be.

De mi az intercept üzleti értelmezése a regressziós modellben? Üzleti értelemben a metszéspont a függő változó alapvonalát vagy kiindulópontját jelenti, ha a független változók nullára vannak állítva. A metszéspont szolgál kiindulópontul a független változók függő változóra gyakorolt ​​hatásának kiértékeléséhez. A függő változónak azt a részét tükrözi, amelyet a modellben szereplő független változók nem befolyásolnak. Segít számszerűsíteni a független változókban bekövetkezett változások hatását ebből az alapértékből. Például egy értékesítés-előrejelzési modellben a lehallgatás a várható eladásokat képviselheti, amikor minden marketing erőfeszítés, azaz a prediktorok nullán állnak. A pénzügyekben a lehallgatás fix vagy általános költségeket jelenthet, amelyek a tevékenység szintjétől vagy egyéb tényezőktől függetlenül felmerülnek. 

Technikailag a lineáris regressziós modellben a metszéspont lehet pozitív, negatív vagy akár nulla.

  1. Pozitív elfogás: Ha a regressziós modellben a metszéspont pozitív, az azt jelenti, hogy a függő változó (Y) előrejelzett értéke, amikor a független változó (X) nulla, pozitív. Ez azt jelenti, hogy a regressziós egyenes a nulla érték felett metszi az y tengelyt.
  2. Negatív elfogás: Ezzel szemben, ha a metszéspont egy lineáris regressziós modellben negatív, az azt jelenti, hogy Y előrejelzett értéke, amikor X nulla, negatív. Ebben az esetben a regressziós egyenes a nulla érték alatt metszi az y tengelyt.
  3. Zero Intercept: Ha egy regressziós modellben a metszéspont nulla, az azt jelenti, hogy a regressziós egyenes átmegy a gráf origóján (0,0). Ez azt jelenti, hogy a függő változó előrejelzett értéke nulla, ha minden független változó is nulla. Más szóval, a regressziós egyenletben nincs további állandó tag. Ez a helyzet rendkívül gyors és nagyon elméleti.

Alapvetően a negatív vagy pozitív elfogással foglalkozik, és amikor a negatív elfogással találkozik, ugyanúgy kezeli a negatív elfogást, mint a pozitív elfogást. Gyakorlati szempontból azonban a negatív elfogásnak van értelme, vagy nem, az elemzett adatok kontextusától függően. Például, ha a napi hőmérsékletet (X) és a fagylalt eladásait (Y) elemzi, a negatív elfogásnak nincs értelme, mivel lehetetlen negatív eladásokat elérni. Más területeken, például a pénzügyi elemzésben azonban értelmes lehet a negatív elfogás.

Az alábbiakban felsorolunk néhány megközelítést, amelyeket figyelembe vehet, ha negatív elfogásai vannak:

  1. Ellenőrizze az adathibákat és a feltételezéseket: Mielőtt bármilyen módosítást végezne, győződjön meg arról, hogy a regressziós feltételezések teljesülnek. Ez magában foglalja a linearitást, a függetlenséget, a homoszkedaszticitást (a reziduumokra vonatkozóan), az adatváltozók és maradékok normálisságát, a kiugró értékeket stb. Ha ezeket a feltételezéseket megsértik, először foglalkozni kell velük.
  2. Alkalmazza az üzleti érzéket és a józan észt, és ellenőrizze, hogy a negatív elfogás értelmezésének van-e gyakorlati értelme. A negatív elfogásnak lehet értelme attól függően, hogy mit jelent a levágás. Például a pénzügyi adatokban a negatív metszéspont nulla alatti kezdőpontot jelezhet, ami teljesen ésszerű lehet. De ha a fagylaltok hőmérsékletére és eladásaira vonatkozó adatokat elemezzük, a negatív elfogásnak nincs értelme, mivel lehetetlen negatív eladásokat elérni.
  3. Állítsa középre a változókat. A regressziós modellek csak az adatértékek adott tartományára érvényesek. Néha azonban a független és a függő változók értékei kívül eshetnek az adott tartományon. Ebben a vonatkozásban a központosítás magában foglalja egy változó (független) állandó értékének vagy számtani átlagának kivonását minden egyes értékéből. Ez megkönnyítheti az értelmezést, különösen akkor, ha a független változók (Xs) nulla értékkel rendelkeznek. Alapvetően a változók átlaguk köré összpontosulva a metszéspont a függő változó előrejelzett értékét jelenti, amikor a független változók az átlagértékükön vannak. Ezenkívül bizonyos esetekben az adatok szélsőséges értékei vagy kiugró értékei a regressziós modellek numerikus instabilitásához vezethetnek. A változók központosítása enyhítheti ezeket a problémákat azáltal, hogy csökkenti a változók skáláját, és stabilabbá teszi a regressziós modellt.
  4. Győződjön meg arról, hogy a zavaró változók szerepelnek a regressziós modellben. További magyarázó változók vagy zavaró változók hozzáadása a regressziós modellhez segíthet megmagyarázni a negatív metszéspontot.

Összességében fontos megjegyezni, hogy a lineáris regressziós modellek feltételezéseken alapulnak. Először is lineáris kapcsolatot feltételeznek a változók között, ami nem mindig igaz a valós forgatókönyvekben. Ezenkívül a lineáris regresszió a normál eloszlású adatoktól függ, és nagyon érzékeny a kiugró értékekre. Végül, de nem utolsósorban, a lineáris regresszió nem teljesít jól nemlineáris összefüggésekkel, és ilyen esetekben az összetettebb modellek, például a polinomiális regresszió vagy a nem lineáris regresszió megfelelőbbek lehetnek.

Referencia

Beszélj velünk

Szia! Miben segíthetek?