Xlera8

Κατανόηση των παρεμβολών γραμμικής παλινδρόμησης σε απλή γλώσσα – DATAVERSITY

Συχνά με ρωτούν για τον ρόλο των τεμαχίων στα μοντέλα γραμμικής παλινδρόμησης – ειδικά για τις αρνητικές παρεμβολές. Εδώ είναι η ανάρτησή μου στο blog μου για αυτό το θέμα με απλά λόγια με ελάχιστους στατιστικούς όρους.  

Τα μοντέλα παλινδρόμησης χρησιμοποιούνται για να γίνουν προβλέψεις. ο συντελεστές στην εξίσωση ορίστε τη σχέση μεταξύ κάθε ανεξάρτητης μεταβλητής και εξαρτημένης μεταβλητής. Η τομή ή η σταθερά στο μοντέλο παλινδρόμησης αντιπροσωπεύει τη μέση τιμή της μεταβλητής απόκρισης όταν όλες οι μεταβλητές πρόβλεψης στο μοντέλο είναι ίσες με μηδέν. Στη γραμμική παλινδρόμηση, η τομή είναι η τιμή της εξαρτημένης μεταβλητής, δηλαδή, Y όταν όλες οι τιμές είναι ανεξάρτητες μεταβλητές και τα X είναι μηδέν. Εάν το X μερικές φορές ισούται με 0, η τομή είναι απλώς η αναμενόμενη τιμή του Y σε αυτήν την τιμή. Μαθηματικά και εικονογραφικά, ένα μοντέλο απλής γραμμικής παλινδρόμησης (SLR) φαίνεται παρακάτω.

Ποια είναι όμως η επιχειρηματική ερμηνεία της υποκλοπής στο μοντέλο παλινδρόμησης; Σε επιχειρηματικούς όρους, μια τομή αντιπροσωπεύει μια γραμμή βάσης ή ένα σημείο εκκίνησης για την εξαρτημένη μεταβλητή, εάν οι ανεξάρτητες μεταβλητές οριστούν στο μηδέν. Η τομή χρησιμεύει ως το σημείο εκκίνησης για την αξιολόγηση των επιδράσεων των ανεξάρτητων μεταβλητών στην εξαρτημένη μεταβλητή. Αντικατοπτρίζει το τμήμα της εξαρτημένης μεταβλητής που δεν επηρεάζεται από τις ανεξάρτητες μεταβλητές που περιλαμβάνονται στο μοντέλο. Βοηθά στην ποσοτικοποίηση του αντίκτυπου των αλλαγών στις ανεξάρτητες μεταβλητές από αυτήν την τιμή βάσης. Για παράδειγμα, σε ένα μοντέλο πρόβλεψης πωλήσεων, η υποκλοπή μπορεί να αντιπροσωπεύει τις αναμενόμενες πωλήσεις όταν όλες οι προσπάθειες μάρκετινγκ, δηλαδή, οι προγνωστικοί παράγοντες είναι στο μηδέν. Στα χρηματοοικονομικά, η αναχαίτιση μπορεί να αντιπροσωπεύει πάγια ή γενικά έξοδα που πραγματοποιούνται ανεξάρτητα από το επίπεδο δραστηριότητας ή άλλους παράγοντες. 

Τεχνικά, η τομή στο μοντέλο γραμμικής παλινδρόμησης μπορεί να είναι θετική, αρνητική ή ακόμα και μηδενική.

  1. Θετική διακοπή: Εάν η τομή στο μοντέλο παλινδρόμησης είναι θετική, σημαίνει ότι η προβλεπόμενη τιμή της εξαρτημένης μεταβλητής (Y) όταν η ανεξάρτητη μεταβλητή (X) είναι μηδέν είναι θετική. Αυτό σημαίνει ότι η γραμμή παλινδρόμησης διασχίζει τον άξονα y πάνω από τη μηδενική τιμή.
  2. Αρνητική διακοπή: Αντίθετα, εάν η τομή σε ένα μοντέλο γραμμικής παλινδρόμησης είναι αρνητική, σημαίνει ότι η προβλεπόμενη τιμή του Y όταν το X είναι μηδέν είναι αρνητική. Σε αυτήν την περίπτωση, η γραμμή παλινδρόμησης διασχίζει τον άξονα y κάτω από τη μηδενική τιμή.
  3. Μηδενική αναχαίτιση: Εάν η τομή σε ένα μοντέλο παλινδρόμησης είναι μηδέν, σημαίνει ότι η γραμμή παλινδρόμησης διέρχεται από την αρχή (0,0) στο γράφημα. Αυτό σημαίνει ότι η προβλεπόμενη τιμή της εξαρτημένης μεταβλητής είναι μηδέν όταν όλες οι ανεξάρτητες μεταβλητές είναι επίσης μηδέν. Με άλλα λόγια, δεν υπάρχει επιπλέον σταθερός όρος στην εξίσωση παλινδρόμησης. Αυτή η κατάσταση είναι εξαιρετικά συχνή και πολύ θεωρητική.

Βασικά, αντιμετωπίζετε αρνητικές ή θετικές παρεμβολές, και όταν συναντάτε την αρνητική υποκλοπή αντιμετωπίζετε την αρνητική υποκλοπή με τον ίδιο τρόπο όπως θα αντιμετωπίζατε μια θετική υποκλοπή. Αλλά σε πρακτικούς όρους, μια αρνητική υποκλοπή μπορεί να έχει ή να μην έχει νόημα ανάλογα με το πλαίσιο των δεδομένων που αναλύονται. Για παράδειγμα, εάν αναλύετε τη θερμοκρασία της ημέρας (X) και τις πωλήσεις παγωτού (Y), μια αρνητική υποκλοπή δεν θα είχε νόημα, καθώς είναι αδύνατο να έχετε αρνητικές πωλήσεις. Ωστόσο, σε άλλους τομείς, όπως η χρηματοοικονομική ανάλυση, μια αρνητική αναχαίτιση θα μπορούσε να έχει νόημα.

Παρακάτω είναι μερικές προσεγγίσεις που μπορείτε να εξετάσετε όταν έχετε αρνητικές υποκλοπές:

  1. Ελέγξτε για σφάλματα και υποθέσεις δεδομένων: Πριν κάνετε οποιεσδήποτε προσαρμογές, βεβαιωθείτε ότι πληρούνται οι υποθέσεις παλινδρόμησης. Αυτό περιλαμβάνει τη γραμμικότητα, την ανεξαρτησία, την ομοσκεδαστικότητα (σχετικά με τα υπολείμματα), την κανονικότητα των μεταβλητών δεδομένων και τα υπολείμματα, τις ακραίες τιμές και άλλα. Εάν παραβιαστούν αυτές οι παραδοχές, είναι απαραίτητο να αντιμετωπιστούν πρώτα.
  2. Εφαρμόστε επιχειρηματική οξυδέρκεια και κοινή λογική και ελέγξτε εάν η ερμηνεία της αρνητικής υποκλοπής έχει πρακτικό νόημα. Μια αρνητική υποκλοπή μπορεί να έχει νόημα ανάλογα με το τι αντιπροσωπεύει η υποκλοπή. Για παράδειγμα, στα οικονομικά δεδομένα, μια αρνητική ανάκλαση θα μπορούσε να υποδεικνύει ένα σημείο εκκίνησης κάτω από το μηδέν, κάτι που μπορεί να είναι απολύτως λογικό. Αλλά αν αναλύετε δεδομένα για τη θερμοκρασία και τις πωλήσεις παγωτού, μια αρνητική υποκλοπή δεν θα είχε νόημα, καθώς είναι αδύνατο να υπάρχουν αρνητικές πωλήσεις.
  3. Κεντράρετε τις μεταβλητές. Τα μοντέλα παλινδρόμησης ισχύουν μόνο για ένα δεδομένο εύρος τιμών δεδομένων. Αλλά μερικές φορές, οι τιμές των ανεξάρτητων και των εξαρτημένων μεταβλητών μπορεί να είναι εκτός του δεδομένου εύρους. Από αυτή την άποψη, το κεντράρισμα περιλαμβάνει την αφαίρεση μιας σταθερής τιμής ή αριθμητικού μέσου όρου μιας μεταβλητής (ανεξάρτητης) από κάθε τιμή της. Αυτό μπορεί να διευκολύνει την ερμηνεία, ειδικά εάν οι ανεξάρτητες μεταβλητές (Xs) έχουν μηδενικές τιμές. Βασικά, κεντράροντας τις μεταβλητές γύρω από τις μέσες τιμές τους, η τομή αντιπροσωπεύει την προβλεπόμενη τιμή της εξαρτημένης μεταβλητής όταν οι ανεξάρτητες μεταβλητές βρίσκονται στις μέσες τιμές τους. Επίσης, σε ορισμένες περιπτώσεις, ακραίες τιμές ή ακραίες τιμές στα δεδομένα μπορεί να οδηγήσουν σε αριθμητική αστάθεια στα μοντέλα παλινδρόμησης. Οι μεταβλητές κεντραρίσματος μπορούν να μετριάσουν αυτά τα ζητήματα μειώνοντας την κλίμακα των μεταβλητών και κάνοντας το μοντέλο παλινδρόμησης πιο σταθερό.
  4. Βεβαιωθείτε ότι οι συγχυτικές μεταβλητές βρίσκονται στο μοντέλο παλινδρόμησης. Η προσθήκη επιπλέον επεξηγηματικών μεταβλητών ή συγχυτικών μεταβλητών στο μοντέλο παλινδρόμησης μπορεί να βοηθήσει στην εξήγηση της αρνητικής τομής.

Συνολικά, είναι σημαντικό να σημειωθεί ότι τα μοντέλα γραμμικής παλινδρόμησης βασίζονται σε υποθέσεις. Πρώτον, υποθέτουν μια γραμμική σχέση μεταξύ των μεταβλητών, η οποία μπορεί να μην ισχύει πάντα σε σενάρια πραγματικού κόσμου. Επιπλέον, η γραμμική παλινδρόμηση εξαρτάται από κανονικά κατανεμημένα δεδομένα και είναι πολύ ευαίσθητη σε ακραίες τιμές. Τελευταίο αλλά εξίσου σημαντικό, η γραμμική παλινδρόμηση μπορεί να μην έχει καλή απόδοση με μη γραμμικές σχέσεις και σε τέτοιες περιπτώσεις, πιο πολύπλοκα μοντέλα όπως η πολυωνυμική παλινδρόμηση ή η μη γραμμική παλινδρόμηση μπορεί να είναι πιο κατάλληλα.

Αναφορά

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?