Fonction d'évaluation des performances du modèle de régression: fonctionnalités et destinations d'application, respectivement

2020er mars 3

Fonction d'évaluation du modèle de régression utilisable avec sckit-learnSur la base de, je résumerai les différences et l'utilisation de chacun. yi est le vrai y et la barre au-dessus est la valeur prédite.

Fonction d'évaluation des performances du modèle de régression

Erreur quadratique moyenne (MSE, RMSE)

$$ \ text {MSE} (y, \ hat {y}) = \ frac {1} {n_ \ text {samples}} \ sum_ {i = 0} ^ {n_ \ text {samples} - 1} (y_i - \ Hat {y} _i (valeur prédite)) ^ 2. $$

L'erreur quadratique moyenne (MSE: erreur quadratique moyenne, RMSE: erreur quadratique moyenne) ajuste le modèle pour minimiser la somme moyenne des erreurs quadratiques. RMSE prend la racine carrée après le carré et aligne la cote avec y.

Fonction d'évaluation de premier choix.Concentrez-vous sur les grandes valeurs(Plus la valeur est élevée, plus l'erreur carrée est grande)Sensible aux valeurs aberrantes, mais utile dans de nombreuses situations où les valeurs aberrantes diminuent de façon exponentielle, comme dans la distribution normale.

Erreur absolue moyenne (MAE)

$$ \ text {MAE} (y, \ hat {y}) = \ frac {1} {n_ {\ text {samples}}} \ sum_ {i = 0} ^ {n_ {\ text {samples}} - 1} \ gauche | y_i - \ hat {y} _i \ droite |. $$

L'erreur absolue moyenne (MAE) ajuste le modèle pour minimiser la somme moyenne des valeurs absolues d'erreur.

De MSEMéthode d'évaluation robuste qui résiste aux valeurs aberrantes.Au contraire, l'apprentissage de données avec des valeurs très différentes est faible.Cependant, il reste une tendance à mettre l'accent sur les grandes valeurs.Pour les ensembles de données qui ont un impact important sur les valeurs aberrantes.

Erreur logarithmique quadratique moyenne

$$ \ text {MSLE} (y, \ hat {y}) = \ frac {1} {n_ \ text {samples}} \ sum_ {i = 0} ^ {n_ \ text {samples} - 1} (\ log_e (1 + y_i) - \ log_e (1 + \ hat {y} _i)) ^ 2. $$

L'erreur logarithmique quadratique moyenne est la moyenne de la somme des carrés pour l'erreur logarithmique y.Il est appliqué aux tâches où y augmente de façon exponentielle, comme la population et les ventes annuelles de produits.Il y a une plus grande pénalité pour la sous-estimation que pour la surestimation.

Erreur absolue médiane (MedAE)

$$ R ^ 2 (y, \ hat {y}) = 1 - \ frac {\ sum_ {i = 1} ^ {n} (y_i - \ hat {y} _i) ^ 2} {\ sum_ {i = 1} ^ {n} (y_i - \ bar {y}) ^ 2} $$

Minimisez la médiane de l'erreur absolue de chaque valeur prédite.Le principe est que plus il y a de valeurs aberrantes, plus l'erreur est grande, mais l'erreur médiane n'en est guère affectée.

Comme il est plus robuste que MAE, il est utile pour les données ne comportant qu'un petit nombre d'échantillons ou pour lesquelles les valeurs aberrantes sont angoissantes mais ne peuvent être exclues.

Erreur moyenne en pourcentage (MPE)

{\ text {MPE}} = {\ frac {100 \%} {n}} \ sum _ {{t = 1}} ^ {n} {\ frac {a_ {t} -f_ {t}} {a_ {t}}}

Le pourcentage d'erreur moyen permet de minimiser le pourcentage moyen (%: pourcentage) qui s'écarte de la valeur mesurée. Non implémenté dans sckit-learn.Cela a l'air bien parce que les valeurs de n'importe quelle région sont traitées comme des erreurs de même poids quelle que soit leur taille, mais il y a quelques problèmes d'utilisation pratique (une erreur se produit lorsque y est égal à 0, ou une très petite valeur). Ensuite,% d'erreur diverge, etc.:De l'anglais wikipedia)

Score R2 (coefficient de détermination)

Corrélation entre les valeurs vraies et préditesIndique, qui correspond à l'ajustement du graphique yy.S'il y a une correspondance exacte, le score R2 sera 2. Parce que le score RXNUMX dépend de l'ensemble de donnéesR² ne peut pas être comparé entre différents ensembles de données.

まとめ

FondamentalementScore R2 et erreur quadratique moyenne (MSE)か Score R2 et erreur absolue moyenne (MAE)Est le meilleur à utiliser ensemble.
Si vous souhaitez mettre en valeur de grandes valeurs et bien connaître les valeurs aberrantes,RMSE.
Si vous souhaitez réduire le poids des valeurs aberrantes,MAE.

Si la cible de prédiction est une valeur qui change de façon exponentielleErreur logarithmique quadratique moyenneIl y en a, mais cela peut également être traité en logarithmisant y.

Si vous disposez d'une petite quantité de données ou si vous ne souhaitez pas exclure les valeurs aberrantes qui ont un impact important,Erreur absolue médiane (MedAE)Est utilisé.

Apprentissage automatiquestatistiques,Régression,Fonction d'évaluation