Necessidade de conversão de escala da variável objetiva [Aprendizado de máquina]
Costuma-se argumentar que a conversão de recursos é importante no aprendizado de máquina e no aprendizado profundo.Por exemplo, os seguintes livros.
Por outro lado, não havia muitas informações sobre a variável objetiva.Portanto, vou resumir o resultado de investigar se a variável objetiva deve ser convertida na tarefa de regressão.
Necessidade de dimensionar a variável objetiva
Claro, há uma necessidade em alguns casos.
Cena necessária
Estatisticamente, é o momento em que os dois seguintes não valem para o erro (residual: diferença entre o valor medido e o valor estimado da regressão).
・ Universalidade
・ Homocedasticidade
Ao calcular a equação de regressão pelo método dos mínimos quadrados, há imparcialidade do erro e homocedasticidade como pré-requisitos.A imparcialidade do erro significa que o valor esperado do erro é 0 em qualquer x.No caso de uma linha de regressão, se a média for em qualquer lugar em x, significa que o erro está nessa linha sem qualquer tendência.
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1182674801
Homocedasticidade significa que a variação do erro (variância) é igual para qualquer x.
Colocando-os juntos, em todo lugar em x, o erro significa que o erro varia em torno da linha de regressão da mesma maneira acima e abaixo dela. O fato de ser igual em todo lugar em x significa que, mesmo que x mude, a distribuição do erro não muda com ele, ou seja, não está correlacionado.
Método de confirmação
Isso pode ser visto no gráfico residual e no gráfico QQ do resíduo.
Solução alternativa e tipo de conversão de escala
Em outras palavras, se os resíduos são analisados e as pré-condições acima não são atendidas (se há alguma tendência para o resíduo), o modelo de regressão pode representar melhor a relação entre xey por processamento matemático.Uma das soluções alternativas é converter a variável objetiva.
Por exemplo, quando a variável objetiva tem um valor que aumenta exponencialmente, o erro aumenta à medida que o intervalo de predição se torna maior.Para expressar tal modelo não linear como um modelo linear, defina a transformação logarítmica (log) para y.
O mais importante é a transformação logarítmica, mas existem outros
- Transformação √ (raiz)
- Conversão Boxcox
- Conversão recíproca
E assim por diante.
No entanto, existem outras soluções alternativas, como aumentar as variáveis, adicionar termos de grau XNUMX ou superior e alterar a função de avaliação.
A variável objetiva em si não precisa ser normalmente distribuída
São os resíduos que precisam ser distribuídos normalmente.Não é uma variável explicativa ou uma variável objetiva.Não entenda errado.A razão pela qual os resíduos precisam ser normalmente distribuídos é que eles correspondem ao denominador da estatística de teste do teste F para análise de variância. Isso ocorre porque a distribuição F é baseada na premissa de que tanto o denominador quanto o numerador são normalmente distribuídos.
As variáveis explicativas e variáveis objetivas da análise de regressão não precisam ser normalmente distribuídas?
Considerando a formação da função de avaliação da análise de regressão, ela funciona bem para dados que não seguem uma distribuição normal, portanto é uma espécie de sentimento plausível.
Esta é a necessidade de conversão numérica na variável objetivo.No final das contas, se a precisão melhorar, acho que a conversão de escala deve ser feita.
discussão
Lista de comentários
Ainda não há comentários