เอ็กซ์เลร่า8

การทำความเข้าใจการสกัดกั้นการถดถอยเชิงเส้นในภาษาธรรมดา - DATAVERSITY

ฉันมักถูกถามเกี่ยวกับบทบาทของจุดตัดในแบบจำลองการถดถอยเชิงเส้น โดยเฉพาะจุดตัดเชิงลบ นี่คือโพสต์บนบล็อกของฉันในหัวข้อนั้นด้วยคำง่ายๆ โดยมีเงื่อนไขทางสถิติน้อยที่สุด  

แบบจำลองการถดถอยใช้ในการทำนาย ที่ สัมประสิทธิ์ในสมการ กำหนดความสัมพันธ์ระหว่างตัวแปรอิสระแต่ละตัวและตัวแปรตาม ค่าตัดกันหรือค่าคงที่ในแบบจำลองการถดถอยแสดงถึงค่าเฉลี่ยของตัวแปรตอบสนอง เมื่อตัวแปรตัวทำนายทั้งหมดในแบบจำลองมีค่าเท่ากับศูนย์ ในการถดถอยเชิงเส้น จุดตัดคือค่าของตัวแปรตาม เช่น Y เมื่อค่าทั้งหมดเป็นตัวแปรอิสระ และ Xs เป็นศูนย์ ถ้าบางครั้ง X เท่ากับ 0 ค่าตัดแกนเป็นเพียงค่าที่คาดหวังของ Y ที่มีค่านั้น แบบจำลองการถดถอยเชิงเส้นอย่างง่าย (SLR) ในทางคณิตศาสตร์และรูปภาพแสดงไว้ด้านล่าง

แต่การตีความทางธุรกิจของการสกัดกั้นในรูปแบบการถดถอยคืออะไร? ในแง่ธุรกิจ จุดตัดแสดงถึงเส้นฐานหรือจุดเริ่มต้นสำหรับตัวแปรตาม หากตัวแปรอิสระตั้งค่าเป็นศูนย์ จุดตัดทำหน้าที่เป็นจุดเริ่มต้นในการประเมินผลกระทบของตัวแปรอิสระต่อตัวแปรตาม โดยสะท้อนถึงส่วนของตัวแปรตามที่ไม่ได้รับอิทธิพลจากตัวแปรอิสระที่รวมอยู่ในแบบจำลอง ช่วยวัดผลกระทบของการเปลี่ยนแปลงในตัวแปรอิสระจากค่าพื้นฐานนี้ ตัวอย่างเช่น ในแบบจำลองการคาดการณ์การขาย การสกัดกั้นอาจแสดงถึงยอดขายที่คาดหวัง เมื่อความพยายามทางการตลาดทั้งหมด กล่าวคือ ตัวทำนายมีค่าเป็นศูนย์ ในด้านการเงิน การสกัดกั้นสามารถแสดงถึงต้นทุนคงที่หรือต้นทุนค่าโสหุ้ยที่เกิดขึ้น โดยไม่คำนึงถึงระดับของกิจกรรมหรือปัจจัยอื่นๆ 

ในทางเทคนิค จุดตัดในแบบจำลองการถดถอยเชิงเส้นอาจเป็นค่าบวก ลบ หรือแม้แต่ศูนย์ก็ได้

  1. การสกัดกั้นเชิงบวก: หากจุดตัดในแบบจำลองการถดถอยเป็นบวก หมายความว่าค่าทำนายของตัวแปรตาม (Y) เมื่อตัวแปรอิสระ (X) เป็นศูนย์จะเป็นค่าบวก นี่หมายความว่าเส้นถดถอยตัดผ่านแกน y เหนือค่าศูนย์
  2. การสกัดกั้นเชิงลบ: ในทางกลับกัน ถ้าจุดตัดในแบบจำลองการถดถอยเชิงเส้นเป็นลบ หมายความว่าค่าที่คาดการณ์ไว้ของ Y เมื่อ X เป็นศูนย์จะเป็นค่าลบ ในกรณีนี้ เส้นการถดถอยจะตัดผ่านแกน y ใต้ค่าศูนย์
  3. การสกัดกั้นเป็นศูนย์: หากจุดตัดในแบบจำลองการถดถอยเป็นศูนย์ แสดงว่าเส้นการถดถอยผ่านจุดกำเนิด (0,0) บนกราฟ ซึ่งหมายความว่าค่าทำนายของตัวแปรตามจะเป็นศูนย์เมื่อตัวแปรอิสระทั้งหมดเป็นศูนย์เช่นกัน กล่าวอีกนัยหนึ่ง ไม่มีค่าคงที่เพิ่มเติมในสมการการถดถอย สถานการณ์นี้มีอัตรามากและเป็นไปตามทฤษฎีมาก

โดยพื้นฐานแล้ว คุณจัดการกับค่าตัดแกนเชิงลบหรือบวก และเมื่อคุณเจอค่าตัดแกนเชิงลบ คุณจะจัดการกับค่าตัดแกนลบในลักษณะเดียวกับที่คุณจัดการกับค่าตัดแกนเชิงบวก แต่ในทางปฏิบัติแล้ว การสกัดกั้นเชิงลบอาจสมเหตุสมผลหรือไม่ก็ได้ ขึ้นอยู่กับบริบทของข้อมูลที่กำลังวิเคราะห์ ตัวอย่างเช่น หากคุณกำลังวิเคราะห์อุณหภูมิของวัน (X) และยอดขายไอศกรีม (Y) ค่าตัดกันเชิงลบจะไม่มีความหมายเนื่องจากเป็นไปไม่ได้ที่จะมียอดขายติดลบ อย่างไรก็ตาม ในขอบเขตอื่นๆ เช่น การวิเคราะห์ทางการเงิน การสกัดกั้นเชิงลบอาจสมเหตุสมผล

ต่อไปนี้เป็นแนวทางบางส่วนที่คุณสามารถพิจารณาได้เมื่อคุณมีจุดตัดกันเชิงลบ:

  1. ตรวจสอบข้อผิดพลาดของข้อมูลและสมมติฐาน: ก่อนทำการปรับเปลี่ยนใดๆ ตรวจสอบให้แน่ใจว่าเป็นไปตามสมมติฐานการถดถอย ซึ่งรวมถึงความเป็นเส้นตรง ความเป็นอิสระ ความเป็นเอกภาพ (เกี่ยวกับสิ่งตกค้าง) ความปกติของตัวแปรข้อมูลและสิ่งตกค้าง ค่าผิดปกติ และอื่นๆ หากสมมติฐานเหล่านี้ถูกละเมิด จำเป็นต้องแก้ไขก่อน
  2. ใช้ความเฉียบแหลมทางธุรกิจและสามัญสำนึก และตรวจสอบว่าการตีความการสกัดกั้นเชิงลบนั้นสมเหตุสมผลหรือไม่ การสกัดกั้นเชิงลบอาจสมเหตุสมผล ขึ้นอยู่กับว่าการสกัดกั้นหมายถึงอะไร ตัวอย่างเช่น ในข้อมูลทางการเงิน ค่าตัดกันเชิงลบอาจบ่งบอกถึงจุดเริ่มต้นที่ต่ำกว่าศูนย์ ซึ่งอาจสมเหตุสมผลอย่างยิ่ง แต่หากคุณกำลังวิเคราะห์ข้อมูลเกี่ยวกับอุณหภูมิและยอดขายไอศกรีม ค่าตัดกันเชิงลบจะไม่มีความหมายเนื่องจากเป็นไปไม่ได้ที่จะมียอดขายติดลบ
  3. จัดตัวแปรให้อยู่ตรงกลาง โมเดลการถดถอยใช้ได้กับช่วงค่าข้อมูลที่กำหนดเท่านั้น แต่บางครั้งค่าของตัวแปรอิสระและตัวแปรตามอาจอยู่นอกช่วงที่กำหนดได้ ในเรื่องนี้ การจัดศูนย์กลางเกี่ยวข้องกับการลบค่าคงที่หรือค่าเฉลี่ยเลขคณิตของตัวแปร (อิสระ) ออกจากแต่ละค่า ซึ่งจะทำให้การตีความง่ายขึ้น โดยเฉพาะถ้าตัวแปรอิสระ (Xs) มีค่าเป็นศูนย์ โดยพื้นฐานแล้ว โดยการทำให้ตัวแปรอยู่ตรงกลางรอบค่าเฉลี่ย ค่าตัดแกนจะแสดงค่าที่ทำนายไว้ของตัวแปรตามเมื่อตัวแปรอิสระอยู่ที่ค่าเฉลี่ย นอกจากนี้ ในบางกรณี ค่าที่มากเกินไปหรือค่าผิดปกติในข้อมูลอาจทำให้เกิดความไม่เสถียรของตัวเลขในแบบจำลองการถดถอย ตัวแปรที่อยู่ตรงกลางสามารถบรรเทาปัญหาเหล่านี้ได้โดยการลดขนาดของตัวแปรและทำให้แบบจำลองการถดถอยมีเสถียรภาพมากขึ้น
  4. ตรวจสอบให้แน่ใจว่าตัวแปรที่ทำให้เกิดความสับสนอยู่ในแบบจำลองการถดถอย การเพิ่มตัวแปรอธิบายเพิ่มเติมหรือตัวแปรที่สับสนให้กับแบบจำลองการถดถอยอาจช่วยอธิบายจุดตัดเชิงลบได้

โดยรวมแล้ว สิ่งสำคัญคือต้องทราบว่าแบบจำลองการถดถอยเชิงเส้นนั้นขึ้นอยู่กับสมมติฐาน ประการแรก พวกเขาถือว่าความสัมพันธ์เชิงเส้นระหว่างตัวแปร ซึ่งอาจไม่ถือเป็นจริงเสมอไปในสถานการณ์จริง นอกจากนี้ การถดถอยเชิงเส้นยังขึ้นอยู่กับข้อมูลที่กระจายตามปกติและมีความไวต่อค่าผิดปกติมาก สุดท้ายแต่ไม่ท้ายสุด การถดถอยเชิงเส้นอาจทำงานได้ไม่ดีกับความสัมพันธ์แบบไม่เชิงเส้น และในกรณีเช่นนี้ แบบจำลองที่ซับซ้อนกว่า เช่น การถดถอยพหุนามหรือการถดถอยแบบไม่เชิงเส้น อาจมีความเหมาะสมมากกว่า

อ้างอิง

แชทกับเรา

สวัสดี! ฉันจะช่วยคุณได้อย่างไร?