प्रतिगमन मॉडल प्रदर्शन मूल्यांकन कार्य: विशेषताएँ और अनुप्रयोग

2020 3 年月日 21

प्रतिगमन मॉडल के लिए मूल्यांकन कार्य जिनका उपयोग स्किट-लर्न के साथ किया जा सकता हैइसके आधार पर, हम प्रत्येक के अंतर और उपयोग को संक्षेप में प्रस्तुत करेंगे। yi सत्य y है, ऊपर का बार अनुमानित मान है।

प्रतिगमन मॉडल प्रदर्शन मूल्यांकन समारोह

औसत चुकता त्रुटि (MSE, RMSE)

$$\text{MSE}(y, \hat{y}) = \frac{1}{n_\text{नमूने}} \sum_{i=0}^{n_\text{नमूने} - 1} (y_i – \hat{y}i(अनुमानित मान))^2.$$

माध्य चुकता त्रुटि (MSE, RMSE) वर्गित त्रुटियों के योग के माध्य को कम करने के लिए मॉडल को समायोजित करता है। RMSE वर्ग निकालने के बाद वर्गमूल लेता है और आयाम को y के साथ संरेखित करता है।

पहली पसंद मूल्यांकन समारोह।मूल्य बड़ा(मान जितना बड़ा होगा, चुकता त्रुटि उतनी ही बड़ी होगी।)आउटलेयर के प्रति संवेदनशील, लेकिन कई स्थितियों में उपयोगी जहां आउटलेयर तेजी से घटते हैं, जैसे कि सामान्य वितरण।

मतलब पूर्ण त्रुटि (एमएई)

$$\text{MAE}(y, \hat{y}) = \frac{1}{n_{\text{नमूने}}} \sum_{i=0}^{n_{\text{नमूने}}- 1} \बाएं| y_i - \hat{y}i \दाएं|.$$

मीन एब्सोल्यूट एरर (MAE) मॉडल को एब्सोल्यूट एरर के औसत को कम करने के लिए एडजस्ट करता है।

एमएसई सेएक मजबूत मूल्यांकन पद्धति जो आउटलेयर के लिए प्रतिरोधी है।इसके विपरीत, मूल्यों में बड़े अंतर वाले डेटा की सीख कमजोर है।हालांकि, बड़े मूल्यों पर जोर देने की प्रवृत्ति बनी हुई है।आउटलेयर पर उच्च प्रभाव वाले डेटासेट के लिए।

माध्य चुकता लॉगरिदमिक त्रुटि

$$\text{MSLE}(y, \hat{y}) = \frac{1}{n_\text{नमूने}} \sum_{i=0}^{n_\text{नमूने} - 1} (\ log_e (1 + y_i) – \log_e (1 + \hat{y}i) )^2.$$

माध्य वर्ग लॉग त्रुटि लघुगणक y में त्रुटि के लिए वर्गों के योग का माध्य है।उन कार्यों में लागू किया जाता है जहाँ y तेजी से बढ़ता है, जैसे जनसंख्या, वार्षिक उत्पाद बिक्री, आदि।overestimation overestimation से अधिक दंडित किया जाता है।

मेडियन निरपेक्ष त्रुटि (MedAE)

$$R^2(y, \hat{y}) = 1 – \frac{\sum_{i=1}^{n} (y_i – \hat{y}i)^2}{\sum_{i= 1}^{n}(y_i – \bar{y})^2}$$

प्रत्येक भविष्यवाणी की औसत पूर्ण त्रुटि को कम करें।यह सिद्धांत कि आउटलेयर में बड़ी त्रुटियाँ हैं, लेकिन माध्यिका त्रुटि उनके द्वारा काफी हद तक अप्रभावित है।

यह एमएई की तुलना में अधिक मजबूत है, इसलिए यह केवल कुछ नमूनों या डेटा के लिए उपयोगी है जहां आउटलेयर एक चिंता का विषय है लेकिन इसे समाप्त नहीं किया जा सकता है।

औसत प्रतिशत त्रुटि (एमपीई)

{\text{MPE}}={\frac {100\%}{n}}\sum _{{t=1}}^{n}{\frac {a_{t}-f_{t}}{a_ {टी}}}

औसत प्रतिशत त्रुटि वास्तविक मूल्यों से विचलित होने वाले प्रतिशत (%: प्रतिशत) के औसत को कम करने के लिए काम करती है। स्किट-लर्न में लागू नहीं किया गया।यह अच्छा लगता है क्योंकि किसी भी क्षेत्र के मान को उसके आकार की परवाह किए बिना समान वजन वाली त्रुटि के रूप में माना जाता है, लेकिन कुछ व्यावहारिक समस्याएं हैं। जहां% त्रुटि अलग हो जाती है, जैसे:अंग्रेजी विकिपीडिया से)

R2 स्कोर (दृढ़ संकल्प का गुणांक)

सच्चे और अनुमानित मूल्यों के बीच संबंधyy प्लॉट के फिट होने की डिग्री के अनुरूप है।एक परिपूर्ण मैच का R2 स्कोर 2 होता है। चूँकि RXNUMX स्कोर डेटासेट पर निर्भर है,भिन्न डेटासेट में R² की तुलना करने में असमर्थ।

सारांश

मूल रूप सेR2 स्कोर और औसत चुकता त्रुटि (MSE)か R2 स्कोर और औसत पूर्ण त्रुटि (MAE)के साथ सबसे अच्छा संयुक्त.
यदि आप बड़े मूल्यों पर जोर देना चाहते हैं और आउटलेयर को अच्छी तरह से सीखना चाहते हैं,आरएमएसई.
यदि आप आउटलेयर का वजन कम करना चाहते हैं,MAE.

यदि भविष्यवाणी लक्ष्य एक घातीय रूप से बदलते मूल्य हैऔसत चुकता लॉगरिदमिक त्रुटिवहाँ भी है, लेकिन इससे y का लघुगणक बनाकर निपटा जा सकता है।

यदि आपके पास बहुत कम डेटा है, या यदि आउटलेयर बहुत प्रभावशाली हैं और आप उन्हें बाहर नहीं करना चाहते हैं,मेडियन निरपेक्ष त्रुटि (MedAE)उपयोग

मशीन लर्निंगआंकड़े,वापसी,मूल्यांकन समारोह