Regressiemodel prestatie-evaluatiefunctie: respectievelijk functies en toepassingsbestemmingen

Evaluatiefunctie van regressiemodel dat kan worden gebruikt met sckit-learnOp basis van, zal ik de verschillen en het gebruik van elk samenvatten. yi is de echte y en de balk erboven is de voorspelde waarde.

Regressiemodel prestatie-evaluatiefunctie

Gemiddelde kwadratische fout (MSE, RMSE)

$$ \ text {MSE} (y, \ hat {y}) = \ frac {1} {n_ \ text {samples}} \ sum_ {i = 0} ^ {n_ \ text {samples} - 1} (y_i - \ Hat {y} _i (voorspelde waarde)) ^ 2. $$

Gemiddelde kwadratische fout (MSE: gemiddelde kwadratische fout, RMSE: gemiddelde kwadratische fout) past het model aan om de gemiddelde som van de kwadratische fouten te minimaliseren. RMSE neemt de vierkantswortel na kwadraat en lijnt de dimensie uit met y.

Eerste keuze evaluatiefunctie.Focus op grote waarden(Hoe groter de waarde, hoe groter de kwadratische fout)Gevoelig voor uitschieters, maar nuttig in veel situaties waarin uitschieters exponentieel afnemen, zoals bij de normale verdeling.

Gemiddelde absolute fout (MAE)

$$ \ text {MAE} (y, \ hat {y}) = \ frac {1} {n_ {\ text {samples}}} \ sum_ {i = 0} ^ {n_ {\ text {samples}} - 1} \ left | y_i - \ hat {y} _i \ right |. $$

Gemiddelde absolute fout (MAE) past het model aan om de gemiddelde som van absolute foutwaarden te minimaliseren.

Van MSERobuuste evaluatiemethode die bestand is tegen uitschieters.Integendeel, het leren van gegevens met sterk verschillende waarden is zwak.Er blijft echter een tendens bestaan ​​om grote waarden te benadrukken.Voor datasets die een grote impact hebben op uitschieters.

Gemiddelde kwadratische logaritmische fout

$$ \ text {MSLE} (y, \ hat {y}) = \ frac {1} {n_ \ text {samples}} \ sum_ {i = 0} ^ {n_ \ text {samples} - 1} (\ log_e (1 + y_i) - \ log_e (1 + \ hat {y} _i)) ^ 2. $$

De gemiddelde logaritmische fout in het kwadraat is het gemiddelde van de som van de kwadraten voor de logaritmische y-fout.Het wordt toegepast op taken waarbij y exponentieel toeneemt, zoals het aantal inwoners en de jaarlijkse productverkoop.Er is een grotere straf voor de onderschatting dan voor de overschatting.

Mediane absolute fout (MedAE)

$$ R ^ 2 (y, \ hat {y}) = 1 - \ frac {\ sum_ {i = 1} ^ {n} (y_i - \ hat {y} _i) ^ 2} {\ sum_ {i = 1} ^ {n} (y_i - \ bar {y}) ^ 2} $$

Minimaliseer de mediaan van de absolute fout van elke voorspelde waarde.Het principe is dat hoe meer uitschieters zijn, hoe groter de fout is, maar de mediaanfout wordt er nauwelijks door beïnvloed.

Omdat het robuuster is dan MAE, is het nuttig voor gegevens met slechts een klein aantal steekproeven of gegevens waarvoor uitbijters angstig zijn, maar niet kunnen worden uitgesloten.

Gemiddelde procentuele fout (MPE)

{\ text {MPE}} = {\ frac {100 \%} {n}} \ sum _ {{t = 1}} ^ {n} {\ frac {a_ {t} -f_ {t}} {a_ {t}}}

De gemiddelde procentuele fout werkt om het gemiddelde percentage (%: procent) dat afwijkt van de gemeten waarde te minimaliseren. Niet geïmplementeerd in sckit-learn.Het ziet er goed uit omdat waarden in elke regio worden behandeld als fouten van hetzelfde gewicht, ongeacht hun grootte, maar er zijn enkele problemen bij praktisch gebruik (er treedt een fout op als y 0 is, of een zeer kleine waarde). Dan% fout divergeert, enz.:Van Engelse wikipedia)

R2-score (determinatiecoëfficiënt)

Correlatie tussen ware en voorspelde waardenGeeft aan, wat overeenkomt met de fit van yy-plot.Als er een exacte match is, is de R2-score 2. Omdat de RXNUMX-score afhankelijk is van de datasetR² is niet te vergelijken tussen verschillende datasets.

ま と め

EigenlijkR2-score en gemiddelde kwadratische fout (MSE)R2-score en gemiddelde absolute fout (MAE)Is het beste om samen te gebruiken.
Als je grote waarden wilt benadrukken en goed uitbijters wilt leren,RMSE.
Als u het gewicht van uitschieters wilt verminderen,MAE.

Als het voorspellingsdoel een waarde is die exponentieel verandertGemiddelde kwadratische logaritmische foutEr is, maar dit kan ook worden aangepakt door y te logaritmiseren.

Als u een kleine hoeveelheid gegevens heeft, of als u uitschieters met een grote impact niet wilt uitsluiten,Mediane absolute fout (MedAE)Is gebruikt.