بگ ڈیٹا

سادہ زبان میں لکیری ریگریشن انٹرسیپٹس کو سمجھنا - ڈیٹاورسٹی

ٹائم سٹیمپ: 26 اپریل 2024 3: 35 AM
ماخذ نوڈ: 2736844

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

مجھ سے اکثر لکیری ریگریشن ماڈلز میں انٹرسیپٹس کے کردار کے بارے میں پوچھا جاتا ہے – خاص طور پر منفی انٹرسیپٹس۔ کم سے کم شماریاتی اصطلاحات کے ساتھ سادہ الفاظ میں اس موضوع پر میری بلاگ پوسٹ یہ ہے۔

پیشن گوئی کرنے کے لیے ریگریشن ماڈل استعمال کیے جاتے ہیں۔ دی مساوات میں گتانک ہر آزاد متغیر اور منحصر متغیر کے درمیان تعلق کی وضاحت کریں۔ ریگریشن ماڈل میں وقفہ یا مستقل ردعمل کے متغیر کی اوسط قدر کی نمائندگی کرتا ہے جب ماڈل میں تمام پیش گوئی کرنے والے متغیر صفر کے برابر ہوتے ہیں۔ لکیری رجعت میں، وقفہ منحصر متغیر کی قدر ہے، یعنی Y جب تمام اقدار آزاد متغیر ہوں، اور Xs صفر ہوں۔ اگر کبھی کبھی X 0 کے برابر ہو جاتا ہے، تو وقفہ صرف اس قدر پر Y کی متوقع قدر ہے۔ ریاضی اور تصویری طور پر، ایک سادہ لکیری ریگریشن (SLR) ماڈل ذیل میں دکھایا گیا ہے۔

لیکن ریگریشن ماڈل میں انٹرسیپٹ کی کاروباری تشریح کیا ہے؟ کاروباری اصطلاحات میں، ایک انٹرسیپٹ انحصار متغیر کے لیے ایک بنیادی لائن یا نقطہ آغاز کی نمائندگی کرتا ہے، اگر آزاد متغیر صفر پر سیٹ کیے جاتے ہیں۔ وقفہ انحصار متغیر پر آزاد متغیرات کے اثرات کا جائزہ لینے کے لیے نقطہ آغاز کے طور پر کام کرتا ہے۔ یہ منحصر متغیر کے اس حصے کی عکاسی کرتا ہے جو ماڈل میں شامل آزاد متغیرات سے متاثر نہیں ہوتا ہے۔ یہ اس بنیادی قدر سے آزاد متغیرات میں ہونے والی تبدیلیوں کے اثرات کو درست کرنے میں مدد کرتا ہے۔ مثال کے طور پر، فروخت کی پیشین گوئی کے ماڈل میں، انٹرسیپٹ متوقع فروخت کی نمائندگی کر سکتا ہے جب مارکیٹنگ کی تمام کوششیں، یعنی پیشین گوئی کرنے والے صفر پر ہوں۔ فنانس میں، انٹرسیپٹ مقررہ یا اوور ہیڈ اخراجات کی نمائندگی کرسکتا ہے جو سرگرمی کی سطح یا دیگر عوامل سے قطع نظر کیے جاتے ہیں۔

تکنیکی طور پر، لکیری ریگریشن ماڈل میں مداخلت مثبت، منفی، یا صفر بھی ہو سکتی ہے۔

مثبت مداخلت: اگر ریگریشن ماڈل میں وقفہ مثبت ہے، تو اس کا مطلب ہے کہ منحصر متغیر (Y) کی پیشین گوئی قدر جب آزاد متغیر (X) صفر ہو تو مثبت ہے۔ اس کا مطلب یہ ہے کہ ریگریشن لائن صفر کی قدر سے اوپر y-axis کو عبور کرتی ہے۔
منفی مداخلت: اس کے برعکس، اگر لکیری ریگریشن ماڈل میں انٹرسیپٹ منفی ہے، تو اس کا مطلب ہے کہ Y کی پیش گوئی کی گئی قدر جب X صفر ہے تو منفی ہے۔ اس صورت میں، ریگریشن لائن صفر کی قدر سے نیچے y-axis کو عبور کرتی ہے۔
زیرو انٹرسیپٹ: اگر ریگریشن ماڈل میں انٹرسیپٹ صفر ہے تو اس کا مطلب ہے کہ ریگریشن لائن گراف پر اصل (0,0) سے گزرتی ہے۔ اس کا مطلب یہ ہے کہ منحصر متغیر کی پیشین گوئی قدر صفر ہے جب تمام آزاد متغیر بھی صفر ہوتے ہیں۔ دوسرے الفاظ میں، رجعت مساوات میں کوئی اضافی مستقل اصطلاح نہیں ہے۔ یہ صورت حال انتہائی شرح اور بہت نظریاتی ہے۔

بنیادی طور پر، آپ منفی یا مثبت مداخلتوں سے نمٹتے ہیں، اور جب آپ منفی مداخلت کے ساتھ آتے ہیں تو آپ منفی مداخلت سے اسی طرح نمٹتے ہیں جیسے آپ مثبت مداخلت سے نمٹتے ہیں۔ لیکن عملی لحاظ سے، تجزیہ کیے جانے والے ڈیٹا کے سیاق و سباق کے لحاظ سے منفی مداخلت کا کوئی مطلب ہو سکتا ہے یا نہیں۔ مثال کے طور پر، اگر آپ دن کے درجہ حرارت (X) اور آئس کریم (Y) کی فروخت کا تجزیہ کر رہے ہیں، تو منفی مداخلت معنی خیز نہیں ہوگی کیونکہ منفی فروخت ہونا ناممکن ہے۔ تاہم، دوسرے ڈومینز جیسے کہ مالیاتی تجزیہ میں، منفی مداخلت کا مطلب ہو سکتا ہے۔

ذیل میں کچھ ایسے طریقے ہیں جن پر آپ غور کر سکتے ہیں جب آپ کے پاس منفی مداخلتیں ہوں:

ڈیٹا کی غلطیوں اور مفروضوں کی جانچ کریں: کوئی بھی ایڈجسٹمنٹ کرنے سے پہلے، اس بات کو یقینی بنائیں کہ رجعت کے مفروضوں کو پورا کیا گیا ہے۔ اس میں خطوط، آزادی، ہم جنس پرستی (باقیات سے متعلق)، ڈیٹا متغیرات اور بقایا جات کی نارملٹی، آؤٹ لیرز اور بہت کچھ شامل ہے۔ اگر ان مفروضوں کی خلاف ورزی ہوتی ہے تو پہلے ان کا ازالہ ضروری ہے۔
کاروباری ذہانت اور کامن سینس کا اطلاق کریں اور چیک کریں کہ کیا منفی مداخلت کی تشریح عملی معنی رکھتی ہے۔ ایک منفی مداخلت اس بات پر منحصر ہو سکتی ہے کہ مداخلت کس چیز کی نمائندگی کرتی ہے۔ مثال کے طور پر، مالیاتی اعداد و شمار میں، منفی مداخلت صفر سے نیچے نقطہ آغاز کی نشاندہی کر سکتی ہے، جو بالکل معقول ہو سکتا ہے۔ لیکن اگر آپ آئس کریم کے درجہ حرارت اور فروخت کے اعداد و شمار کا تجزیہ کر رہے ہیں، تو منفی مداخلت معنی خیز نہیں ہوگی کیونکہ منفی فروخت ہونا ناممکن ہے۔
متغیرات کو مرکز کریں۔ ریگریشن ماڈلز صرف ڈیٹا ویلیوز کی دی گئی رینج کے لیے درست ہیں۔ لیکن بعض اوقات، آزاد اور منحصر متغیر کی قدریں دی گئی حد سے باہر ہو سکتی ہیں۔ اس سلسلے میں، سنٹرنگ میں اس کی ہر قدر سے متغیر (آزاد) کے مستقل قدر یا ریاضی کے اوسط کو گھٹانا شامل ہے۔ یہ تشریح کو آسان بنا سکتا ہے، خاص طور پر اگر آزاد متغیرات (Xs) کی قدریں صفر ہوں۔ بنیادی طور پر، متغیرات کو ان کے ذرائع کے ارد گرد مرکوز کر کے، انٹرسیپٹ انحصار متغیر کی پیشین گوئی شدہ قدر کی نمائندگی کرتا ہے جب آزاد متغیر اپنی اوسط قدروں پر ہوتے ہیں۔ نیز، بعض صورتوں میں، اعداد و شمار میں انتہائی قدریں یا آؤٹ لیرز ریگریشن ماڈلز میں عددی عدم استحکام کا باعث بن سکتے ہیں۔ سینٹرنگ متغیر متغیرات کے پیمانے کو کم کرکے اور ریگریشن ماڈل کو مزید مستحکم بنا کر ان مسائل کو کم کرسکتے ہیں۔
یقینی بنائیں کہ الجھنے والے متغیرات ریگریشن ماڈل میں ہیں۔ ریگریشن ماڈل میں اضافی وضاحتی متغیرات یا متضاد متغیرات کو شامل کرنے سے منفی مداخلت کی وضاحت میں مدد مل سکتی ہے۔

مجموعی طور پر، یہ نوٹ کرنا ضروری ہے کہ لکیری ریگریشن ماڈل مفروضوں پر مبنی ہیں۔ سب سے پہلے، وہ متغیرات کے درمیان ایک خطی تعلق فرض کرتے ہیں، جو حقیقی دنیا کے منظرناموں میں ہمیشہ درست نہیں ہو سکتے۔ مزید برآں، لکیری رجعت کا انحصار عام طور پر تقسیم شدہ ڈیٹا پر ہوتا ہے اور یہ آؤٹ لیرز کے لیے بہت حساس ہوتا ہے۔ آخری لیکن کم از کم، لکیری رجعت غیر خطی تعلقات کے ساتھ اچھی کارکردگی کا مظاہرہ نہیں کر سکتی ہے، اور ایسی صورتوں میں، زیادہ پیچیدہ ماڈلز جیسے کثیر الثانی رجعت یا غیر لکیری رجعت زیادہ مناسب ہو سکتے ہیں۔

حوالہ