Логистическая регрессия: различия между версиями

Материал из Поле цифровой дидактики
Нет описания правки
Нет описания правки
 
Строка 20: Строка 20:
; <math>\sigma(x) = \frac{1}{1 + e^{-x}} = \frac{e^x}{1 + e^x}</math>
; <math>\sigma(x) = \frac{1}{1 + e^{-x}} = \frac{e^x}{1 + e^x}</math>
: где <math>e</math> — основание натурального логарифма (число Эйлера, ≈ 2.718).
: где <math>e</math> — основание натурального логарифма (число Эйлера, ≈ 2.718).
==== Множественная логистическая регрессия ====
При наличии нескольких [[предиктор]]ов <math>x_1, x_2, \ldots, x_k</math>:
<math>p_i = \frac{1}{1 + \exp(-(\beta_0 + \beta_1 x_{i1} + \beta_2 x_{i2} + \cdots + \beta_k x_{ik}))}</math>
или в матричной форме:
<math>p_i = \sigma(\mathbf{x}_i^T \boldsymbol{\beta})</math>
где <math>\mathbf{x}_i = (1, x_{i1}, x_{i2}, \ldots, x_{ik})^T</math> — вектор предикторов с единицей для интерцепта, <math>\boldsymbol{\beta} = (\beta_0, \beta_1, \ldots, \beta_k)^T</math> — вектор коэффициентов.

Текущая версия от 14:55, 22 ноября 2025


Описание Логистическая регрессия (logistic regression) — это статистический метод анализа и моделирования бинарных (двухклассовых) результатов, где зависимая переменная принимает одно из двух возможных значений (например, "да/нет", "успех/неудача", "работает/не работает"). В отличие от линейной регрессии, логистическая регрессия моделирует вероятность принадлежности наблюдения к одному из двух классов.
Область знаний
Авторы
Поясняющее видео
Близкие понятия Регрессия, Логистическая функция
Среды и средства для освоения понятия R

Логистическая регрессия была разработана в начале XX века как расширение логистического уравнения роста численности популяции. В статистике и машинном обучении метод получил широкое распространение с 1970-х годов и сейчас является одним из самых популярных инструментов в социально-экономической статистике, медицине и других областях, благодаря своей интерпретируемости и эффективности.

В логистической регрессии зависимая переменная [math]\displaystyle{ y }[/math] принимает одно из двух значений:

[math]\displaystyle{ y \in \{0, 1\} }[/math]
или в более общем виде:
[math]\displaystyle{ y \in \{\text{«класс A»}, \text{«класс B»}\} }[/math]

В контексте социально-экономической статистики примеры включают:

  • Трудовая деятельность: работает (1) / не работает (0)
  • Образование: завершил обучение (1) / отчислен (0)
  • Финансовое поведение: открыл счет (1) / не открыл (0)
  • Предпринимательство: создал бизнес (1) / не создал (0)

В основе логистической регрессии лежит логистическая функция, которая преобразует любое вещественное число в значение между 0 и 1:

[math]\displaystyle{ \sigma(x) = \frac{1}{1 + e^{-x}} = \frac{e^x}{1 + e^x} }[/math]
где [math]\displaystyle{ e }[/math] — основание натурального логарифма (число Эйлера, ≈ 2.718).


Множественная логистическая регрессия

При наличии нескольких предикторов [math]\displaystyle{ x_1, x_2, \ldots, x_k }[/math]:

[math]\displaystyle{ p_i = \frac{1}{1 + \exp(-(\beta_0 + \beta_1 x_{i1} + \beta_2 x_{i2} + \cdots + \beta_k x_{ik}))} }[/math]

или в матричной форме:

[math]\displaystyle{ p_i = \sigma(\mathbf{x}_i^T \boldsymbol{\beta}) }[/math]

где [math]\displaystyle{ \mathbf{x}_i = (1, x_{i1}, x_{i2}, \ldots, x_{ik})^T }[/math] — вектор предикторов с единицей для интерцепта, [math]\displaystyle{ \boldsymbol{\beta} = (\beta_0, \beta_1, \ldots, \beta_k)^T }[/math] — вектор коэффициентов.