Короткое определение

MAE (Mean Absolute Error) — это средняя абсолютная величина ошибок прогноза. Она показывает, насколько сильно в среднем наши предсказанные значения отклоняются от реальных, при этом все ошибки учитываются одинаково. Чем меньше MAE, тем точнее модель.


Подробное объяснение

MAE переводится как «Средняя Абсолютная Ошибка». Это очень интуитивно понятная и простая в расчетах метрика.

Как рассчитывается MAE?

Формула выглядит так:

MAE = ( Σ |yᵢ - ŷᵢ| ) / n

Где:

  • yᵢ — реальное значение.
  • ŷᵢ (y-hat) — предсказанное моделью значение.
  • | | — знак модуля (абсолютного значения).
  • n — общее количество наблюдений.
  • Σ — знак суммы.

Процесс расчета состоит из 3 простых шагов:

  1. Вычислить абсолютные ошибки: Для каждого предсказания найдите разницу между реальным и предсказанным значением и возьмите ее по модулю (|yᵢ - ŷᵢ|). Модуль убирает знак, превращая все ошибки в положительные числа.
  2. Найти сумму: Сложите все абсолютные ошибки.
  3. Найти среднее значение: Разделите полученную сумму на количество наблюдений.

Простой пример (для сравнения с RMSE)

Используем те же данные, что и в примере с RMSE: мы предсказываем цену дома (в тыс. долларов).

| Реальная цена (yᵢ) | Предсказанная цена (ŷᵢ) | Абсолютная ошибка |yᵢ - ŷᵢ| | | :----------------- | :---------------------- | :----------------------------- | | 200 | 210 | 10 | | 300 | 290 | 10 | | 400 | 380 | 20 | | 500 | 510 | 10 | | 600 | 550 | 50 |

Теперь посчитаем MAE:

  1. Сумма абсолютных ошибок: 10 + 10 + 20 + 10 + 50 = 100
  2. Среднее значение (MAE): 100 / 5 = 20

Вывод: В среднем наши предсказания отклоняются от реальных цен на 20 тысяч долларов.


Сравнение MAE и RMSE

Давайте сразу сравним результаты из двух примеров:

  • MAE = 20
  • RMSE ≈ 25.3

Почему RMSE получился больше? Потому что RMSE, за счет возведения в квадрат, сильнее “штрафует” за крупные ошибки. В нашем примере была одна большая ошибка в 50 тысяч, которая сильно повлияла на RMSE, но на MAE повлияла так же, как и все остальные.

Ключевые различия:

ХарактеристикаMAE (Mean Absolute Error)RMSE (Root Mean Square Error)
Формулаy - ŷ
Чувствительность к выбросамМеньше. Все ошибки учитываются линейно и одинаково.Больше. Крупные ошибки усиливаются из-за квадрата.
ИнтерпретацияПростая и прямая: “средняя величина ошибки”.Менее интуитивная, но широко принятая.
Математические свойстваНе везде дифференцируема (из-за модуля, в точке 0).Дифференцируема везде, что удобно для оптимизации.
Единицы измеренияИсходные единицы (например, доллары, метры).Исходные единицы.

Когда использовать MAE?

Используйте MAE, когда:

  1. Все ошибки одинаково важны. Вам безразлично, есть ли несколько больших промахов или много маленьких — вы хотите знать просто среднее отклонение.
  2. В ваших данных есть выбросы. MAE более устойчива к ним и даст более репрезентативную картину о типичной ошибке для большинства данных.
  3. Вам нужна максимально простая и понятная метрика для объяснения бизнесу или не технической аудитории. “Средняя ошибка — 20 тысяч” понять легче, чем “корень из среднего квадратов ошибок — 25.3 тысячи”.

Используйте RMSE, когда:

  1. Крупные ошибки критически недопустимы и их нужно избегать любой ценой (например, предсказание уровня паводка, где недооценка может быть катастрофической).
  2. Ошибки распределены нормально, и вы хотите метрику с хорошими математическими свойствами для оптимизации.

Резюме

  • MAE — это простая и устойчивая метрика, показывающая среднюю абсолютную величину ошибки.
  • Она рассчитывается как среднее арифметическое от абсолютных значений ошибок.
  • Чем меньше MAE, тем лучше модель.
  • Ключевое преимущество: Устойчивость к выбросам и простая интерпретация.
  • Основной конкурент: RMSE, которая более чувствительна к большим ошибкам.

В идеале, при оценке модели лучше смотреть на обе метрики вместе, чтобы получить полное представление о характере ошибок.