Soluções recomendadas à falta de dados
Existem dois métodos para lidar com a falta de dados que tornaram-se disponíveis no software estatístico grosso da população nos últimos anos. Estes dois métodos são vastas melhorias sobre as abordagens tradicionais, como descrito em Limitações para abordagens comuns à falta de dados. Este artigo descreve esses dois métodos.
Ambos os métodos discutidos aqui exigem que o mecanismo de dados em falta é ignorada, isto é, não relacionadas com os valores em falta (ver Faltando Mecanismos de Dados). Se o mecanismo é ignorada, resultando estimativas (ou seja, os parâmetros de regressão e erros padrão) vai ser imparcial, sem perda de potência.
O primeiro método é imputação múltipla (MI). Assim como os métodos de imputação discutidos Limitações para abordagens comuns à falta de dados, imputação múltipla preenche estimativas para os dados em falta. No entanto, para capturar a incerteza em tais estimativas, MI imputa os valores várias vezes. Porque ele usa um método de imputação com o erro embutido, as estimativas múltiplas devem ser semelhantes, mas não idênticas. O resultado é múltiplos conjuntos de dados com valores idênticos para todos os valores não ausentes e valores ligeiramente diferentes para os valores imputadas em cada conjunto de dados. A análise estatística de interesse, tais como ANOVA ou regressão logística, é realizada separadamente em cada conjunto de dados, e os resultados são então combinados. Por causa da variação nos valores imputados, também deve haver variação nas estimativas de parâmetros, levando a estimativas adequadas de erros padrão e valores de p adequadas.
A imputação múltipla está disponível em SAS, S-Plus, e Solas. Em SAS, Proc MI cria os múltiplos conjuntos de dados, que pode, então, ser facilmente analisados separadamente, utilizando procedimentos estatísticos convencionais. PROC MIANALYZE, então, combinar os resultados dessas análises separadas. Joe Schafer na Penn State tem desenvolvido quatro bibliotecas S-Plus para múltiplos procedendo à extrapolação, categóricas, dados normais mista, e do painel. Ele fez a biblioteca para dados normais disponíveis como um pacote autônomo gratuito chamado NORM. A imputação múltipla também está disponível em Solas, mas seus algoritmos têm sido questionadas como impróprio, e não podemos recomendar o seu uso no momento.
O segundo método é analisar os dados incompletos, conjunto completo usando estimativa de probabilidade máxima. Este método não faz a imputação de todos os dados, mas sim usa todos os dados observados para cada caso, para calcular as estimativas de máxima verossimilhança. A estimativa de probabilidade máxima de um parâmetro é o valor do parâmetro que é mais provável que resultaram nos dados observados. Quando os dados estão faltando, podemos levar a função de verossimilhança. A probabilidade é calculado separadamente para os casos com dados completos de algumas variáveis e aqueles com dados completos sobre todas as variáveis. Estas duas probabilidades são então maximizada em conjunto para encontrar as estimativas. Como imputação múltipla, este método dá as estimativas dos parâmetros imparciais e erros padrão. Uma vantagem é que ele não requer a selecção cuidadosa das variáveis utilizadas para imputar os valores que imputação múltipla exige. É, no entanto, limitada a modelos lineares.
A análise dos dados incompletos, conjunto completo usando estimativa da probabilidade máxima está disponível em AMOS. AMOS é um pacote de modelagem de equações estruturais, mas pode executar vários modelos de regressão linear. AMOS é fácil de usar e agora está integrado no SPSS, mas não vai produzir gráficos residuais, estatísticas influência, e outra saída típica de pacotes de regressão. O valor do pacote em análise faltando SPSS vai fazer algumas estimativas de máxima verossimilhança muito limitadas para meios e correlações única
Referências:.
Schafer, J. Software para imputação múltipla
Hox, JJ (1999) Uma revisão de software atual para a Manipulação de Dados ausentes, Kwantitatieve Methoden, 62, 123-138.
Allison, P. (2000). A imputação múltipla de dados perdidos: A Cautionary Tale, métodos sociológicos e Research, 28, 301-309 Restaurant ..
consultoria de negócios
- Tecnologia Aztec Que Ainda adoça Nosso paladar e superou o Conquistador
- Relatório de crédito livre Serviços para melhor empréstimos financeiros on-line
- Criando passiva renda córregos
- Chamadas internacionais VoIP
- Módulos principais fornecidas por Octashop para empresas de comércio eletrônico
- Marca Made Simple
- Descubra dicas e truques que podem ajudá-lo a maximizar seus ganhos de entalhe
- Como Comprar Títulos Corporativos
- Melhor amigo do Mailman
- Faça a sua empresa de correio profissional quarto e Prompt
- Os fornecedores de VoIP oferece muitos recursos avançados
- Aumentar as vendas: 7 estratégias mais eficazes para aumentar as taxas de conversão
- Estratégias principais para Engine Optimization Pesquisa Seo
- Sistemas de telefone de escritório
- VOIP: O que é
- Os tipos de franquia propriedade
- Consultants pode ajudar a desenvolver sua campanha de marketing e-mail
- Melhores maneiras de Brochura dobra tripla Writing
- 6 elementos vitais de um Plano de Crescimento de Negócios
- Como comprar uma franquia Caminho Inteligente