Necessità di conversione di scala della variabile obiettivo [Machine learning]

2020 年 3 月 19 日

Si sostiene spesso che la conversione delle funzionalità sia importante nell'apprendimento automatico e nell'apprendimento profondo.Ad esempio, i seguenti libri.

D'altra parte, non c'erano molte informazioni sulla variabile obiettivo.Pertanto, riassumerò il risultato dell'indagine se la variabile obiettivo debba essere convertita nel task di regressione.

Necessità di scalare la variabile oggettiva

Certo, in alcuni casi è necessario.

Scena necessaria

Statisticamente, è il momento in cui i seguenti due non valgono per l'errore (residuo: differenza tra il valore misurato e il valore stimato della regressione).
・ Universalità
・ Omoscedasticità

Quando si calcola l'equazione di regressione con il metodo dei minimi quadrati, sono prerequisiti l'imparzialità dell'errore e l'omoscedasticità.L'imparzialità dell'errore significa che il valore atteso dell'errore è 0 in qualsiasi x.Nel caso di una linea di regressione, se mediata ovunque in x, significa che l'errore è su quella linea senza alcuna distorsione.
L'omoscedasticità significa che la variazione dell'errore (varianza) è uguale per ogni x.

Mettendoli insieme, ovunque in x, l'errore significa che l'errore varia intorno alla linea di regressione nello stesso modo sopra e sotto di essa. Il fatto che sia lo stesso ovunque in x significa che anche se x cambia, la distribuzione dell'errore non cambia con essa, cioè non è correlata.

https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1182674801

Come controllare

Questi possono essere visti nel diagramma dei residui e nel diagramma QQ del residuo.

File: distanze di arresto auto R 1920 + linear.svg
Esempio di trama residua

Soluzione alternativa e tipo di conversione della scala

In altre parole, se i residui vengono analizzati e le precondizioni di cui sopra non sono soddisfatte (se c'è una certa tendenza per il residuo a esserlo), il modello di regressione può rappresentare meglio la relazione tra x e y mediante elaborazione matematica.Una delle soluzioni alternative è convertire la variabile obiettivo.

Ad esempio, quando la variabile obiettivo ha un valore che aumenta in modo esponenziale, l'errore aumenta all'aumentare dell'intervallo di previsione.Per esprimere un tale modello non lineare come un modello lineare, impostare la trasformazione logaritmica (log) su y.

La più importante è la trasformazione logaritmica, ma ce ne sono altre

  • √ (radice) trasformazione
  • Conversione Boxcox
  • Conversione reciproca

E così via.

Tuttavia, esistono altre soluzioni alternative, come aumentare le variabili, aggiungere termini di grado XNUMX o superiore e modificare la funzione di valutazione.

La variabile obiettivo stessa non deve essere distribuita normalmente

Sono i residui che devono essere distribuiti normalmente.Non è una variabile esplicativa o una variabile oggettiva.Non fraintendetemi.Il motivo per cui i residui devono essere distribuiti normalmente è che corrispondono al denominatore della statistica test del test F per l'analisi della varianza. Questo perché la distribuzione F si basa sulla premessa che sia il denominatore che il numeratore sono normalmente distribuiti.

Le variabili esplicative e le variabili oggettive dell'analisi di regressione non hanno bisogno di essere distribuite normalmente?

Considerando la formazione della funzione di valutazione dell'analisi di regressione, funziona bene per i dati che non seguono una distribuzione normale, quindi è una sorta di sensazione plausibile.

Questa è la necessità della conversione numerica nella variabile oggettiva.In definitiva, se la precisione migliora, ritengo che dovrebbe essere eseguita la conversione della scala.