Avaliando o ajuste Modelos de Regressão

Um modelo de regressão bem ajustadas resulta em valores previstos próximas aos valores de dados observados. O modelo de média, que utiliza a média para cada valor previsto, geralmente seria usado se não houvesse variáveis ​​de previsão informativos. O ajuste de um modelo de regressão proposto deve, pois, ser melhor do que o ajuste do modelo de média

Três estatísticas são usadas em Mínimos Quadrados Ordinários (MQO) regressão para avaliar o ajuste do modelo:. R-quadrado, o F- geral teste, eo erro Root Mean Square (RMSE). Todos os três são baseados em duas somas de quadrados: Soma dos Quadrados Total (SST) e Soma dos Quadrados Error (SSE). SST mede o quanto os dados são da média e medidas de SSE quão longe os dados são valores previstos do modelo. Diferentes combinações desses dois valores fornecem informações diferentes sobre como o modelo de regressão compara ao modelo de média.


R-quadrado ajustado de R ao quadrado e

A diferença entre SST e SSE é a melhoria predição a partir do modelo de regressão, em comparação com o modelo de média. Dividindo essa diferença por SST dá R-quadrado. É proporcional à melhoria na predição a partir do modelo de regressão, em comparação com o modelo de média. Ele indica a qualidade do ajuste do modelo

R-quadrado tem a propriedade útil que a sua escala é intuitivo:. Que varia de zero a um, com zero de indicando que o modelo proposto não melhorar a previsão sobre a média e um modelo de previsão, indicando perfeito. Melhoria no modelo de regressão resultado em aumentos proporcionais em R ao quadrado.

Uma armadilha de R ao quadrado é que ele só pode aumentar como preditores são adicionados ao modelo de regressão. Este aumento é artificial quando preditores não estão realmente melhorando o ajuste do modelo. Para remediar esta situação, uma estatística relacionada, Ajustado de R ao quadrado, incorpora graus do modelo de liberdade. Ajustado vai diminuir como preditores são adicionados se o aumento do ajuste do modelo não compensar a perda de graus de liberdade ao quadrado-R. Da mesma forma, ele vai aumentar como preditores são adicionados se o aumento do ajuste do modelo vale a pena. Ajustado ao quadrado-R deve ser sempre usado com modelos com mais de uma variável de previsão. Ele é interpretado como a proporção da variância total que é explicada pelo modelo.

Há situações em que não é necessário ou pertinente uma elevada ao quadrado-R. Quando o interesse é a relação entre as variáveis, e não na previsão, a praça-R é menos importante. Um exemplo é um estudo sobre como a religiosidade afeta os resultados de saúde. Um bom resultado é uma relação de confiança entre religiosidade e saúde. Ninguém esperaria que a religião explica a elevada percentagem da variação na saúde, como a saúde é afetada por muitos outros fatores. Mesmo que o modelo é responsável por outras variáveis ​​conhecidas de afectar a saúde, como renda e idade, uma na faixa de 0,10 a 0,15 ao quadrado-R é razoável.

O F-teste

A F-teste avalia a hipótese nula de que todos os coeficientes de regressão são iguais a zero versus a alternativa de que pelo menos um não. Uma hipótese nula é equivalente que R-quadrado é igual a zero. A F-teste significativo indica que a observada R-quadrado é de confiança, e não é um resultado espúrio de esquisitices no conjunto de dados. Assim, o teste F determina se a relação proposta entre a variável resposta eo conjunto de preditores é estatisticamente confiável, e pode ser útil quando o objetivo da pesquisa é ou previsão ou explicação.

RMSE

O RMSE é a raiz quadrada da variância dos resíduos. Ele indica o ajuste absoluto do modelo para os dados - como fechar os pontos de dados observados são para valores previstos do modelo. Considerando R-quadrado é uma medida relativa de ajuste, RMSE é uma medida absoluta de ajuste. Tal como a raiz quadrada da variância, RMSE pode ser interpretado como o desvio padrão da variância inexplicada, e tem a propriedade de ser útil nas mesmas unidades como variável de resposta. Menores valores de RMSE indicam melhor ajuste. RMSE é uma boa medida de como o modelo prevê com precisão a resposta, e é o critério mais importante para o ajuste se o principal objetivo do modelo é previsão.

A melhor medida de ajuste do modelo depende dos objetivos do pesquisador, e mais do que um, são muitas vezes úteis. As estatísticas discutidos acima são aplicáveis ​​aos modelos de regressão que utilizam estimativa OLS. Muitos tipos de modelos de regressão, no entanto, como os modelos mistos, modelos lineares generalizados e modelos de história do evento, use estimativa da probabilidade máxima. Estas estatísticas não estão disponíveis para esses modelos. Um boletim futuro irá descrever como avaliar modelos estimados utilizando máxima verossimilhança

Direitos Autorais e cópia; 2008, Karen Grace-Martin Restaurant

consultoria de negócios

  1. Uma das principais soluções de Voz sobre IP fornece
  2. Como À tela Provedor de Serviços em Nuvem
  3. Qual é melhor Pisos - tapete ou laminado?
  4. Conceitos em Regressão Linear Você Precisa Saber Antes de Aprendizagem multinível Modelos
  5. Breve História do Níquel Fio de cobre
  6. Fine Food Queensland Expo 2012 é mais do que apenas um Foodie Delight
  7. Computer Services
  8. Soluções Web marketing para seu negócio que vai Viral
  9. Benefícios da contratação de um consultor de design
  10. *** A liberdade de expressão no Local de Trabalho: Uma Visão Empreendedora
  11. Obter Econômico Folhetos através de impressão barato no Reino Unido
  12. Com Voice Over IP que você começa clara vocação
  13. Fontes de soldagem que salvar sua vida
  14. Solicitors Emprego Explique Resolução Alternativa de Litígios
  15. Eficiência Vem Padrão
  16. Como encontrar Tradies Melbourne e Sydney?
  17. Benefícios em soluções de terceirização de TI
  18. Custo-Benefício online Publicar recomendações e dicas
  19. A importância de altos e baixos na negociação
  20. Grande verão oferece