Qual a diferença entre r-squared e r-squared ajustado?

Coeficiente R2 ajustado, diferenças para o R2 (machine learning) (Novembro 2024)

Coeficiente R2 ajustado, diferenças para o R2 (machine learning) (Novembro 2024)
Qual a diferença entre r-squared e r-squared ajustado?
Anonim
a:

Uma diferença importante entre R-squared e R-squared ajustado é que R-squared supõe que toda variável independente no modelo explica a variação na variável dependente. Dá a porcentagem de variação explicada como se todas as variáveis ​​independentes no modelo afetem a variável dependente, enquanto que o R-quadrado ajustado dá a porcentagem de variação explicada apenas pelas variáveis ​​independentes que, na realidade, afetam a variável dependente. R-quadrado não pode verificar se o coeficiente figurativo e suas previsões são prejudicados. Também não mostra se um modelo de regressão é satisfatório; pode mostrar uma figura de R-quadrado para um bom modelo, ou uma figura R-quadrada alta para um modelo que não se encaixa.

O R-quadrado ajustado compara o poder descritivo dos modelos de regressão que incluem diversos números de preditores. Todo preditor adicionado a um modelo aumenta R-quadrado e nunca diminui. Assim, um modelo com mais termos pode parecer ter um ajuste melhor apenas pelo fato de ter mais termos, enquanto o R-quadrado ajustado compensa a adição de variáveis ​​e só aumenta se o novo termo aumenta o modelo acima do que seria obtido por probabilidade e diminui quando um preditor aumenta o modelo menos do que o previsto por acaso. Em uma condição de superposição, obtém-se um valor incorretamente alto de R-quadrado, o que leva a uma diminuição da capacidade de predição. Este não é o caso com o R-quadrado ajustado.

O R-squared ajustado é uma versão modificada de R-squared para o número de preditores em um modelo. O R-quadrado ajustado pode ser negativo, mas nem sempre, enquanto um valor R-quadrado está entre zero e 100 e mostra a relação linear na amostra de dados, mesmo quando não existe uma relação básica. O R-quadrado ajustado é a melhor estimativa do grau de relacionamento na população básica. Para mostrar a correlação dos modelos com R-squared, escolha o modelo com o limite mais alto, mas a melhor e mais fácil maneira de comparar os modelos é selecionar um com R-quadrado ajustado menor. O R-squared ajustado não é um modelo típico para comparar modelos não-lineares, mas regressões lineares múltiplas.