Обсуждение:Как провести регрессионный анализ

Материал из Поле цифровой дидактики

Дополнение с датасетом про бизнес

Как мы исследовали зависимости из датасета про бизнес

Дополнение с датасетом про кофе

Как проводился регрессионный анализ датасета про кофе:

How does (Data.Scores.Acidity) depend on (Data.Scores.Total)?

 LSRL: Data.Scores.Acidity = 0,08482 (Data.Scores.Total) - NaN 
 N = 989, ρ = 0,8197, r2 = 0,6719

Regression details

 slope	0,08482	95% CI = [0,08112, 0,08852]
 intercept	0,5867	95% CI = [0,2829, 0,8905]
 testing slope ≠ 0 
 t = 45, P < 0.0001
 df = 987,  α = 0,05, t* = 1,96, 


Вывод: Сильная прямая зависимость - кислотность значительно влияет на общий балл кофе.

Ключевые цифры:

Сильная связь: ρ = 0.82 (очень высокая корреляция)

Объясняет 67%: R² = 0.67 - кислотность определяет 67% изменений общего балла

Статзначимо: P < 0.0001 - связь не случайна

Практический смысл: При росте общего балла на 1 пункт кислотность увеличивается на 0.085 балла

Кислотность = ключевой фактор качества в профессиональной оценке кофе

Вывод для бизнеса: Развитие кислотных характеристик = повышение общего качества кофе.