Función de evaluación del rendimiento del modelo de regresión: características y destinos de la aplicación, respectivamente

Función de evaluación del modelo de regresión que se puede utilizar con sckit-learnBasado en, resumiré las diferencias y el uso de cada uno. yi es la verdadera y, y la barra de arriba es el valor predicho.

Función de evaluación del desempeño del modelo de regresión

Error cuadrático medio (MSE, RMSE)

$$ \ text {MSE} (y, \ hat {y}) = \ frac {1} {n_ \ text {samples}} \ sum_ {i = 0} ^ {n_ \ text {samples} - 1} (y_i - \ Hat {y} _i (valor predicho)) ^ 2. $$

El error cuadrático medio (MSE: error cuadrático medio, RMSE: error cuadrático medio de la raíz) ajusta el modelo para minimizar la suma promedio de errores cuadráticos. RMSE toma la raíz cuadrada tras el cuadrado y alinea la dimensión con y.

Función de evaluación de primera elección.Centrarse en grandes valores(Cuanto mayor sea el valor, mayor será el error cuadrado)Sensible a valores atípicos, pero útil en muchas situaciones donde los valores atípicos disminuyen exponencialmente, como en la distribución normal.

Error absoluto medio (MAE)

$$ \ text {MAE} (y, \ hat {y}) = \ frac {1} {n_ {\ text {samples}}} \ sum_ {i = 0} ^ {n_ {\ text {samples}} - 1} \ left | y_i - \ hat {y} _i \ right |. $$

El error absoluto medio (MAE) ajusta el modelo para minimizar la suma media de los valores absolutos del error.

De MSEMétodo de evaluación robusto que es resistente a valores atípicos.Por el contrario, el aprendizaje de datos con valores muy diferentes es débil.Sin embargo, persiste la tendencia a enfatizar los valores grandes.Para conjuntos de datos que tienen un gran impacto en los valores atípicos.

Error logarítmico cuadrático medio

$$ \ text {MSLE} (y, \ hat {y}) = \ frac {1} {n_ \ text {samples}} \ sum_ {i = 0} ^ {n_ \ text {samples} - 1} (\ log_e (1 + y_i) - \ log_e (1 + \ hat {y} _i)) ^ 2. $$

El error logarítmico cuadrático medio es el promedio de la suma de cuadrados del error y logarítmico.Se aplica a tareas en las que y aumenta exponencialmente, como la población y las ventas anuales de productos.Hay una pena mayor por la subestimación que por la sobreestimación.

Error absoluto mediano (MedAE)

$$ R ^ 2 (y, \ hat {y}) = 1 - \ frac {\ sum_ {i = 1} ^ {n} (y_i - \ hat {y} _i) ^ 2} {\ sum_ {i = 1} ^ {n} (y_i - \ bar {y}) ^ 2} $$

Minimice la mediana del error absoluto de cada valor predicho.El principio es que cuanto más valores atípicos son, mayor es el error, pero el error medio apenas se ve afectado por él.

Dado que es más robusto que MAE, es útil para datos con solo una pequeña cantidad de muestras y datos para los cuales los valores atípicos están ansiosos pero no pueden excluirse.

Error porcentual medio (MPE)

{\ text {MPE}} = {\ frac {100 \%} {n}} \ sum _ {{t = 1}} ^ {n} {\ frac {a_ {t} -f_ {t}} {a_ {t}}}

El error de porcentaje promedio funciona para minimizar el porcentaje promedio (%: porcentaje) que se desvía del valor medido. No implementado en sckit-learn.Se ve bien porque los valores en cualquier región se tratan como errores del mismo peso independientemente de su tamaño, pero hay algunos problemas en el uso práctico (se produce un error cuando y es 0, o un valor muy pequeño). Entonces,% error diverge, etc.:De wikipedia en inglés)

Puntuación R2 (coeficiente de determinación)

Correlación entre valores verdaderos y predichosIndica, que corresponde al ajuste de la gráfica yy.Si hay una coincidencia exacta, la puntuación R2 será 2. Porque la puntuación RXNUMX depende del conjunto de datosR² no se puede comparar entre diferentes conjuntos de datos.

Resumen

BásicamentePuntuación R2 y error cuadrático medio (MSE)Puntuación R2 y error absoluto medio (MAE)Es lo mejor para usar juntos.
Si desea enfatizar grandes valores y aprender bien los valores atípicos,RMSE.
Si desea reducir el peso de los valores atípicos,MAE.

Si el objetivo de la predicción es un valor que cambia exponencialmenteError logarítmico cuadrático medioLa hay, pero esto también se puede resolver logaritmizando y.

Si tiene una pequeña cantidad de datos o si no desea excluir valores atípicos que tienen un gran impacto,Error absoluto mediano (MedAE)Se utiliza.