Necessidade de conversão de escala da variável objetiva [Aprendizado de máquina]

2020 ano 3 mês 19 dia

Costuma-se argumentar que a conversão de recursos é importante no aprendizado de máquina e no aprendizado profundo.Por exemplo, os seguintes livros.

Por outro lado, não havia muitas informações sobre a variável objetiva.Portanto, vou resumir o resultado de investigar se a variável objetiva deve ser convertida na tarefa de regressão.

Necessidade de dimensionar a variável objetiva

Claro, há uma necessidade em alguns casos.

Cena necessária

Estatisticamente, é o momento em que os dois seguintes não valem para o erro (residual: diferença entre o valor medido e o valor estimado da regressão).
・ Universalidade
・ Homocedasticidade

Ao calcular a equação de regressão pelo método dos mínimos quadrados, há imparcialidade do erro e homocedasticidade como pré-requisitos.A imparcialidade do erro significa que o valor esperado do erro é 0 em qualquer x.No caso de uma linha de regressão, se a média for em qualquer lugar em x, significa que o erro está nessa linha sem qualquer tendência.
Homocedasticidade significa que a variação do erro (variância) é igual para qualquer x.

Colocando-os juntos, em todo lugar em x, o erro significa que o erro varia em torno da linha de regressão da mesma maneira acima e abaixo dela. O fato de ser igual em todo lugar em x significa que, mesmo que x mude, a distribuição do erro não muda com ele, ou seja, não está correlacionado.

https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1182674801

Método de confirmação

Isso pode ser visto no gráfico residual e no gráfico QQ do resíduo.

Arquivo: distâncias de parada do carro R 1920 + linear.svg
Exemplo de parcela residual

Solução alternativa e tipo de conversão de escala

Em outras palavras, se os resíduos são analisados ​​e as pré-condições acima não são atendidas (se há alguma tendência para o resíduo), o modelo de regressão pode representar melhor a relação entre xey por processamento matemático.Uma das soluções alternativas é converter a variável objetiva.

Por exemplo, quando a variável objetiva tem um valor que aumenta exponencialmente, o erro aumenta à medida que o intervalo de predição se torna maior.Para expressar tal modelo não linear como um modelo linear, defina a transformação logarítmica (log) para y.

O mais importante é a transformação logarítmica, mas existem outros

  • Transformação √ (raiz)
  • Conversão Boxcox
  • Conversão recíproca

E assim por diante.

No entanto, existem outras soluções alternativas, como aumentar as variáveis, adicionar termos de grau XNUMX ou superior e alterar a função de avaliação.

A variável objetiva em si não precisa ser normalmente distribuída

São os resíduos que precisam ser distribuídos normalmente.Não é uma variável explicativa ou uma variável objetiva.Não entenda errado.A razão pela qual os resíduos precisam ser normalmente distribuídos é que eles correspondem ao denominador da estatística de teste do teste F para análise de variância. Isso ocorre porque a distribuição F é baseada na premissa de que tanto o denominador quanto o numerador são normalmente distribuídos.

As variáveis ​​explicativas e variáveis ​​objetivas da análise de regressão não precisam ser normalmente distribuídas?

Considerando a formação da função de avaliação da análise de regressão, ela funciona bem para dados que não seguem uma distribuição normal, portanto é uma espécie de sentimento plausível.

Esta é a necessidade de conversão numérica na variável objetivo.No final das contas, se a precisão melhorar, acho que a conversão de escala deve ser feita.