Big Data

Понимание перехватов линейной регрессии простым языком – DATAVERSITY

Отметка времени: 26 апреля 2024 г. 3: 35 А.М.
Исходный узел: 2736844

Переиздано Платоном

Меня часто спрашивают о роли точек пересечения в моделях линейной регрессии, особенно об отрицательных точках пересечения. Вот мой пост в блоге на эту тему, изложенный простыми словами с минимальным количеством статистических терминов.

Регрессионные модели используются для прогнозирования. коэффициенты в уравнении определить связь между каждой независимой переменной и зависимой переменной. Перехват или константа в модели регрессии представляет собой среднее значение переменной отклика, когда все переменные-предикторы в модели равны нулю. В линейной регрессии точкой пересечения является значение зависимой переменной, т. е. Y, когда все значения являются независимыми переменными, а X равны нулю. Если X иногда равно 0, точка пересечения — это просто ожидаемое значение Y при этом значении. Математически и графически ниже показана простая модель линейной регрессии (SLR).

Но какова деловая интерпретация перехвата в регрессионной модели? С точки зрения бизнеса, точка пересечения представляет собой базовую линию или отправную точку для зависимой переменной, если независимые переменные установлены на ноль. Перехват служит отправной точкой для оценки влияния независимых переменных на зависимую переменную. Он отражает часть зависимой переменной, на которую не влияют независимые переменные, включенные в модель. Это помогает количественно оценить влияние изменений независимых переменных по сравнению с этим базовым значением. Например, в модели прогнозирования продаж перехват может представлять ожидаемые продажи, когда все маркетинговые усилия, т. е. предикторы равны нулю. В финансах перехват может представлять собой постоянные или накладные расходы, которые возникают независимо от уровня деятельности или других факторов.

Технически точка пересечения в модели линейной регрессии может быть положительной, отрицательной или даже нулевой.

Положительный перехват: Если точка пересечения в модели регрессии положительна, это означает, что прогнозируемое значение зависимой переменной (Y), когда независимая переменная (X) равна нулю, является положительным. Это означает, что линия регрессии пересекает ось Y выше нулевого значения.
Отрицательный перехват: И наоборот, если точка пересечения в модели линейной регрессии отрицательна, это означает, что прогнозируемое значение Y, когда X равно нулю, отрицательно. В этом случае линия регрессии пересекает ось Y ниже нулевого значения.
Нулевой перехват: Если точка пересечения в модели регрессии равна нулю, это означает, что линия регрессии проходит через начало координат (0,0) на графике. Это означает, что прогнозируемое значение зависимой переменной равно нулю, когда все независимые переменные также равны нулю. Другими словами, в уравнении регрессии нет дополнительного постоянного члена. Эта ситуация чрезвычайно нормальна и очень теоретическая.

По сути, вы имеете дело с отрицательными или положительными перехватами, и когда вы сталкиваетесь с отрицательным перехватом, вы поступаете с отрицательным перехватом так же, как если бы вы имели дело с положительным перехватом. Но на практике отрицательный перехват может иметь или не иметь смысла в зависимости от контекста анализируемых данных. Например, если вы анализируете дневную температуру (X) и продажи мороженого (Y), отрицательный перехват не будет иметь смысла, поскольку отрицательные продажи невозможны. Однако в других областях, таких как финансовый анализ, отрицательный перехват может иметь смысл.

Ниже приведены некоторые подходы, которые вы можете рассмотреть, если у вас есть отрицательные перехваты:

Проверьте наличие ошибок в данных и допущений. Прежде чем вносить какие-либо корректировки, убедитесь, что предположения регрессии выполняются. Сюда входят линейность, независимость, гомоскедастичность (относительно остатков), нормальность переменных данных и остатков, выбросы и многое другое. Если эти предположения нарушаются, необходимо в первую очередь устранить их.
Примените деловую хватку и здравый смысл и проверьте, имеет ли интерпретация отрицательного перехвата практический смысл. Отрицательный перехват может иметь смысл в зависимости от того, что представляет собой перехват. Например, в финансовых данных отрицательный перехват может указывать на начальную точку ниже нуля, что может быть вполне разумным. Но если вы анализируете данные о температуре и продажах мороженого, отрицательный перехват не будет иметь смысла, поскольку отрицательные продажи невозможны.
Центрируйте переменные. Модели регрессии действительны только для заданного диапазона значений данных. Но иногда значения независимых и зависимых переменных могут выходить за пределы заданного диапазона. В связи с этим центрирование предполагает вычитание постоянного значения или среднего арифметического значения переменной (независимой) из каждого ее значения. Это может облегчить интерпретацию, особенно если независимые переменные (X) имеют нулевые значения. По сути, центрируя переменные вокруг их средних значений, точка пересечения представляет прогнозируемое значение зависимой переменной, когда независимые переменные имеют свои средние значения. Кроме того, в некоторых случаях экстремальные значения или выбросы в данных могут привести к числовой нестабильности в моделях регрессии. Центрирование переменных может смягчить эти проблемы за счет уменьшения масштаба переменных и повышения стабильности регрессионной модели.
Убедитесь, что в регрессионной модели присутствуют мешающие переменные. Добавление дополнительных объясняющих переменных или искажающих переменных в регрессионную модель может помочь объяснить отрицательный перехват.

В целом важно отметить, что модели линейной регрессии основаны на предположениях. Во-первых, они предполагают линейную связь между переменными, которая не всегда справедлива в реальных сценариях. Кроме того, линейная регрессия зависит от нормально распределенных данных и очень чувствительна к выбросам. И последнее, но не менее важное: линейная регрессия может неэффективно работать с нелинейными отношениями, и в таких случаях более подходящими могут быть более сложные модели, такие как полиномиальная регрессия или нелинейная регрессия.

Справка

SEO-контент и PR-распределение. Получите усиление сегодня.
PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
Источник: https://www.dataversity.net/understanding-linear-regression-intercepts-in-plain-language/

Теги: a, О нас, выше, через, деятельность, сообразительность, Добавление, дополнительный, Дополнительно, адрес, корректировки, Все, причислены, всегда, am, an, анализ, проанализированы, Анализируя, Анализируя данные, и, любой, подать заявление, подходы, соответствующий, МЫ, арифметика, около, AS, спросил, предполагать, предположения, At, Ось, основанный, Базовая линия, в основном, BE, до, не являетесь, Ниже, между, Блог, сообщение в блоге, бизнес, Но, by, CAN, случаев, случаев, центр, центрирование, изменения, проверка, как, комплекс, Рассматривать, постоянная, КОНТЕКСТ, Наоборот, Расходы, может, крем, данным, ДАТАВЕРСИЯ, день, сделка, определять, зависимый, в зависимости, зависит, распределенный, доменов, e, каждый, легче, эффекты, усилия, обеспечивать, равный, Равно, Уравнение, Ошибки, особенно, оценки, Даже, пример, ожидаемый, Ожидаемое значение, Объяснять, пояснительная, экстремальный, чрезвычайно, факторы, финансы, финансовый, финансовые данные, First, Во-первых, фиксированной, Что касается, например, от, данный, График, Есть, Документи, помогает, здесь, держать, Однако, i, ICE, мороженое, if, Влияние, подразумевает, важную, что она, in, В других, включены, включает в себя, понесены, независимость, Независимый, указывать, влияние, нестабильность, перехват, интерпретация, включает в себя, Is, вопросы, IT, ЕГО, язык, Фамилия, вести, Наименее, уровень, такое как, линия, линейный, Линейная регрессия, сделать, Делает, Создание, Маркетинг, математически, май, значить, значимым, означает, встретивший, Мощь, минимальный, смягчать, модель, Модели, БОЛЕЕ , my, необходимо, отрицательный, нет, нелинейный, нормально, в своих размышлениях, of, ., on, только, or, Origin, Другое, выбросы, внешнюю, общий, накладные расходы, проходит, в совершенстве, выполнять, относящиеся, простой, Платон, Платон Интеллектуальные данные, ПлатонДанные, точка, полиномиальная регрессия, часть, Положительный, после, практический, предсказанный, прогноз, Predictions, Predictor, ассортимент, скорость, реальные, реальный мир, разумный, снижение, ссылка, отражает, Считать, независимо, регресс, Модель регрессии, отношения, Отношения, представлять, представляет, ответ, роль, s, главная, то же, Шкала, Сценарии, смысл, чувствительный, служит, набор, показанный, просто, Простые слова, Просто, с, ситуация, некоторые, иногда, стабильный, начиная, статистический, Такие, технически, Температура, срок, terms, который, Ассоциация, График, их, Их, теоретический, Там, Эти, они, этой, Через, в, тема, правда, Понимание, Использованные, действительный, ценностное , ценности, Технология, переменные, очень, нарушаться, путь, ЧТО Ж, Что, Что такое, После появления, Который?, , слова, Мир, бы, X, Ты, зефирнет, нуль

Кслера8

Понимание перехватов линейной регрессии простым языком – DATAVERSITY

Переиздано Платоном

Bitcoin Price Signals Uptrend Continuation But Patience Is The Key

Hightower Advisors и SouthState Bank раскрывают инвестиции в спотовые биткойн-ETF

Предупреждение о ките: инвестор Ethereum (ETH) зафиксировал миллионную прибыль после годичного удержания

Амбиции Apple в области искусственного интеллекта проявляются в преддверии мероприятия по iPad – расшифровать

Чат с нами