Функция оценки производительности регрессионной модели: функции и места назначения приложений соответственно

Функция оценки регрессионной модели, которую можно использовать с sckit-learnИсходя из этого, я резюмирую различия и способы использования каждого из них. yi - истинное значение y, а полоса над ним - прогнозируемое значение.

Функция оценки производительности регрессионной модели

Среднеквадратичная ошибка (MSE, RMSE)

$$ \ text {MSE} (y, \ hat {y}) = \ frac {1} {n_ \ text {samples}} \ sum_ {i = 0} ^ {n_ \ text {samples} - 1} (y_i - \ Hat {y} _i (прогнозируемое значение)) ^ 2. $$

Среднеквадратичная ошибка (MSE: среднеквадратичная ошибка, RMSE: среднеквадратичная ошибка) корректирует модель, чтобы минимизировать среднюю сумму квадратов ошибок. RMSE извлекает квадратный корень после квадрата и выравнивает размер по оси y.

Функция оценки первого выбора.Сосредоточьтесь на больших ценностях(Чем больше значение, тем больше квадратная ошибка)Чувствителен к выбросам, но полезен во многих ситуациях, когда выбросы уменьшаются экспоненциально, например, при нормальном распределении.

Средняя абсолютная ошибка (MAE)

$$ \ text {MAE} (y, \ hat {y}) = \ frac {1} {n_ {\ text {samples}}} \ sum_ {i = 0} ^ {n_ {\ text {samples}} - 1} \ left | y_i - \ hat {y} _i \ right |. $$

Средняя абсолютная ошибка (MAE) регулирует модель, чтобы минимизировать среднюю сумму абсолютных значений ошибки.

От MSEНадежный метод оценки, устойчивый к выбросам.Напротив, изучение данных с сильно различающимися значениями является слабым.Однако сохраняется тенденция подчеркивать большие ценности.Для наборов данных, которые имеют большое влияние на выбросы.

Среднеквадратичная логарифмическая ошибка

$$ \ text {MSLE} (y, \ hat {y}) = \ frac {1} {n_ \ text {samples}} \ sum_ {i = 0} ^ {n_ \ text {samples} - 1} (\ log_e (1 + y_i) - \ log_e (1 + \ hat {y} _i)) ^ 2. $$

Среднеквадратичная логарифмическая ошибка - это среднее значение суммы квадратов логарифмической ошибки y.Он применяется к задачам, где y увеличивается экспоненциально, например к населению и годовым продажам продукции.За недооценку наказание больше, чем за переоценку.

Средняя абсолютная ошибка (MedAE)

$$ R ^ 2 (y, \ hat {y}) = 1 - \ frac {\ sum_ {i = 1} ^ {n} (y_i - \ hat {y} _i) ^ 2} {\ sum_ {i = 1} ^ {n} (y_i - \ bar {y}) ^ 2} $$

Минимизируйте медианное значение абсолютной ошибки каждого предсказанного значения.Принцип заключается в том, что ошибка становится больше, чем значение выброса, но это почти не влияет на среднюю ошибку.

Поскольку он более надежен, чем MAE, он полезен для данных с небольшим количеством выборок и данных, выбросы которых вызывают беспокойство, но не могут быть исключены.

Средняя процентная ошибка (MPE)

{\ text {MPE}} = {\ frac {100 \%} {n}} \ sum _ {{t = 1}} ^ {n} {\ frac {a_ {t} -f_ {t}} {a_ {t}}}

Средняя процентная ошибка работает, чтобы минимизировать средний процент (%: процент), который отклоняется от измеренного значения. Не реализовано в sckit-learn.Это выглядит хорошо, потому что значения в любой области обрабатываются как ошибки одного и того же веса независимо от их размера, но при практическом использовании возникают некоторые проблемы (ошибка возникает, когда y равен 0 или очень маленькому значению). Тогда% ошибки расходится и т. д .:Из английской википедии)

Оценка R2 (коэффициент детерминации)

Корреляция между истинными и прогнозируемыми значениямиУказывает, что соответствует подгонке графика yy.Если есть точное совпадение, оценка R2 будет 2. Поскольку оценка RXNUMX зависит от набора данныхR² нельзя сравнивать между разными наборами данных.

ま と め

в основномОценка R2 и среднеквадратичная ошибка (MSE)Оценка R2 и средняя абсолютная ошибка (MAE)Лучше всего использовать вместе.
Если вы хотите выделить большие значения и хорошо изучить выбросы,СКО.
Если вы хотите уменьшить количество выбросов,ДЕД.

Если целью прогноза является значение, которое изменяется экспоненциальноСреднеквадратичная логарифмическая ошибкаЕсть, но с этим также можно справиться, логарифмируя y.

Если у вас небольшой объем данных или вы не хотите исключать выбросы, которые имеют большое влияние,Средняя абсолютная ошибка (MedAE)Используется.