Xlera8

सामान्य भाषा में रेखीय प्रतिगमन अवरोधन को समझना - डेटा विविधता

मुझसे अक्सर रैखिक प्रतिगमन मॉडल में इंटरसेप्ट की भूमिका के बारे में पूछा जाता है - विशेष रूप से नकारात्मक इंटरसेप्ट। यहां उस विषय पर न्यूनतम सांख्यिकीय शब्दों के साथ सरल शब्दों में मेरा ब्लॉग पोस्ट है।  

पूर्वानुमान लगाने के लिए प्रतिगमन मॉडल का उपयोग किया जाता है। समीकरण में गुणांक प्रत्येक स्वतंत्र चर और आश्रित चर के बीच संबंध को परिभाषित करें। प्रतिगमन मॉडल में अवरोधन या स्थिरांक प्रतिक्रिया चर के औसत मूल्य का प्रतिनिधित्व करता है जब मॉडल में सभी भविष्यवक्ता चर शून्य के बराबर होते हैं। रैखिक प्रतिगमन में, अवरोधन आश्रित चर का मान है, अर्थात, Y जब सभी मान स्वतंत्र चर होते हैं, और Xs शून्य होते हैं। यदि X कभी-कभी 0 के बराबर होता है, तो अवरोधन उस मान पर Y का अपेक्षित मान होता है। गणितीय और चित्रात्मक रूप से, एक सरल रैखिक प्रतिगमन (एसएलआर) मॉडल नीचे दिखाया गया है।

लेकिन प्रतिगमन मॉडल में अवरोधन की व्यावसायिक व्याख्या क्या है? व्यावसायिक संदर्भ में, यदि स्वतंत्र चर शून्य पर सेट हैं, तो एक अवरोधन आश्रित चर के लिए आधार रेखा या प्रारंभिक बिंदु का प्रतिनिधित्व करता है। आश्रित चर पर स्वतंत्र चर के प्रभावों का मूल्यांकन करने के लिए अवरोधन प्रारंभिक बिंदु के रूप में कार्य करता है। यह आश्रित चर के उस हिस्से को दर्शाता है जो मॉडल में शामिल स्वतंत्र चर से प्रभावित नहीं होता है। यह इस आधारभूत मूल्य से स्वतंत्र चर में परिवर्तनों के प्रभाव को मापने में मदद करता है। उदाहरण के लिए, बिक्री भविष्यवाणी मॉडल में, इंटरसेप्ट अपेक्षित बिक्री का प्रतिनिधित्व कर सकता है जब सभी विपणन प्रयास, यानी, भविष्यवक्ता शून्य पर हों। वित्त में, अवरोधन निश्चित या ओवरहेड लागतों का प्रतिनिधित्व कर सकता है जो गतिविधि के स्तर या अन्य कारकों की परवाह किए बिना खर्च की जाती हैं। 

तकनीकी रूप से, रैखिक प्रतिगमन मॉडल में अवरोधन सकारात्मक, नकारात्मक या शून्य भी हो सकता है।

  1. सकारात्मक अवरोधन: यदि प्रतिगमन मॉडल में अवरोधन सकारात्मक है, तो इसका मतलब है कि स्वतंत्र चर (एक्स) शून्य होने पर आश्रित चर (वाई) का अनुमानित मूल्य सकारात्मक है। इसका तात्पर्य यह है कि प्रतिगमन रेखा शून्य मान से ऊपर y-अक्ष को पार करती है।
  2. नकारात्मक अवरोधन: इसके विपरीत, यदि एक रेखीय प्रतिगमन मॉडल में अवरोधन नकारात्मक है, तो इसका मतलब है कि जब X शून्य है तो Y का अनुमानित मान नकारात्मक है। इस स्थिति में, प्रतिगमन रेखा शून्य मान से नीचे y-अक्ष को पार करती है।
  3. शून्य अवरोधन: यदि प्रतिगमन मॉडल में अवरोधन शून्य है, तो इसका मतलब है कि प्रतिगमन रेखा ग्राफ़ पर मूल बिंदु (0,0) से होकर गुजरती है। इसका मतलब यह है कि आश्रित चर का अनुमानित मान शून्य है जब सभी स्वतंत्र चर भी शून्य हैं। दूसरे शब्दों में, प्रतिगमन समीकरण में कोई अतिरिक्त स्थिर पद नहीं है। यह स्थिति अत्यंत दर और बहुत सैद्धांतिक है.

मूल रूप से, आप नकारात्मक या सकारात्मक अवरोधन से निपटते हैं, और जब आप नकारात्मक अवरोधन के सामने आते हैं तो आप नकारात्मक अवरोधन से उसी तरह निपटते हैं जैसे आप सकारात्मक अवरोधन से निपटते हैं। लेकिन व्यावहारिक रूप से, विश्लेषण किए जा रहे डेटा के संदर्भ के आधार पर एक नकारात्मक अवरोधन का कोई मतलब हो भी सकता है और नहीं भी। उदाहरण के लिए, यदि आप दिन के तापमान (एक्स) और आइसक्रीम की बिक्री (वाई) का विश्लेषण कर रहे हैं, तो एक नकारात्मक अवरोधन सार्थक नहीं होगा क्योंकि नकारात्मक बिक्री होना असंभव है। हालाँकि, वित्तीय विश्लेषण जैसे अन्य क्षेत्रों में, एक नकारात्मक अवरोधन का अर्थ हो सकता है।

नीचे कुछ दृष्टिकोण दिए गए हैं जिन पर आप नकारात्मक अवरोधन होने पर विचार कर सकते हैं:

  1. डेटा त्रुटियों और मान्यताओं की जाँच करें: कोई भी समायोजन करने से पहले, सुनिश्चित करें कि प्रतिगमन धारणाएँ पूरी हो गई हैं। इसमें रैखिकता, स्वतंत्रता, समरूपता (अवशेषों से संबंधित), डेटा चर और अवशेषों की सामान्यता, आउटलेर और बहुत कुछ शामिल हैं। यदि इन धारणाओं का उल्लंघन होता है, तो पहले उनका समाधान करना आवश्यक है।
  2. व्यावसायिक कौशल और सामान्य ज्ञान को लागू करें और जांचें कि नकारात्मक अवरोधन की व्याख्या व्यावहारिक समझ में आती है या नहीं। एक नकारात्मक अवरोधन का अर्थ इस पर निर्भर हो सकता है कि अवरोधन क्या दर्शाता है। उदाहरण के लिए, वित्तीय डेटा में, एक नकारात्मक अवरोधन शून्य से नीचे एक प्रारंभिक बिंदु का संकेत दे सकता है, जो पूरी तरह से उचित हो सकता है। लेकिन यदि आप आइसक्रीम के तापमान और बिक्री पर डेटा का विश्लेषण कर रहे हैं, तो एक नकारात्मक अवरोधन सार्थक नहीं होगा क्योंकि नकारात्मक बिक्री होना असंभव है।
  3. चरों को केन्द्रित करें। प्रतिगमन मॉडल केवल डेटा मानों की दी गई श्रेणी के लिए मान्य हैं। लेकिन कभी-कभी, स्वतंत्र और आश्रित चर के मान दी गई सीमा से बाहर हो सकते हैं। इस संबंध में, सेंटरिंग में किसी चर (स्वतंत्र) के स्थिर मान या अंकगणितीय माध्य को उसके प्रत्येक मान से घटाना शामिल है। इससे व्याख्या आसान हो सकती है, खासकर यदि स्वतंत्र चर (Xs) का मान शून्य हो। मूल रूप से, चर को उनके साधनों के आसपास केंद्रित करके, अवरोधन आश्रित चर के अनुमानित मूल्य का प्रतिनिधित्व करता है जब स्वतंत्र चर अपने औसत मूल्यों पर होते हैं। साथ ही, कुछ मामलों में, डेटा में अत्यधिक मान या आउटलेर्स प्रतिगमन मॉडल में संख्यात्मक अस्थिरता पैदा कर सकते हैं। चर को केन्द्रित करना, चर के पैमाने को कम करके और प्रतिगमन मॉडल को अधिक स्थिर बनाकर इन मुद्दों को कम कर सकता है।
  4. सुनिश्चित करें कि भ्रमित करने वाले चर प्रतिगमन मॉडल में हैं। प्रतिगमन मॉडल में अतिरिक्त व्याख्यात्मक चर या भ्रमित करने वाले चर जोड़ने से नकारात्मक अवरोधन को समझाने में मदद मिल सकती है।

कुल मिलाकर, यह ध्यान रखना महत्वपूर्ण है कि रैखिक प्रतिगमन मॉडल मान्यताओं पर आधारित हैं। सबसे पहले, वे चरों के बीच एक रैखिक संबंध मानते हैं, जो वास्तविक दुनिया के परिदृश्यों में हमेशा सच नहीं हो सकता है। इसके अतिरिक्त, रैखिक प्रतिगमन सामान्य रूप से वितरित डेटा पर निर्भर करता है और आउटलेर्स के प्रति बहुत संवेदनशील है। अंतिम लेकिन महत्वपूर्ण बात, रैखिक प्रतिगमन गैर-रेखीय संबंधों के साथ अच्छा प्रदर्शन नहीं कर सकता है, और ऐसे मामलों में, बहुपद प्रतिगमन या गैर-रेखीय प्रतिगमन जैसे अधिक जटिल मॉडल अधिक उपयुक्त हो सकते हैं।

संदर्भ

हमारे साथ चैट करें

नमस्ते! मैं आपकी कैसे मदद कर सकता हूँ?