Bootstrapping regression in stata forex


Estou tentando bootstrap uma regressão stepwise em Stata e extrair os coeficientes bootstrapped. Eu tenho dois arquivos separados ado. Swpbs é o comando que o usuário usa, que chama o comando helper swpbssimulator. A saída é um conjunto de dados dos coeficientes bootstrap. Meu problema é que a saída parece ser dependente do resultado da primeira simulação de regressão stepwise. Por exemplo, se eu tivesse as variáveis ​​independentes var1 var2 var3 var4 ea primeira stepwise simulação inclui apenas var1 e var2 no modelo, então apenas var1 e var2 aparecerão em modelos subseqüentes. Se a primeira simulação incluir var1 var2 e var3 então somente var1 var2 e var3 aparecerão em modelos subseqüentes, assumindo que eles são significativos (se não seus coeficientes aparecerão como pontos). Por exemplo, a saída incorreta é apresentada abaixo. As variáveis ​​peso, idade, lbph, svi, gleason e pgg45 nunca aparecem se não aparecerem na primeira simulação. Eu quero coeficientes que não estão incluídos no modelo para sempre aparecer como pontos no conjunto de dados e eu quero simulações subseqüentes para não ser aparentemente dependente da primeira simulação. Pergunta Jul 10 13 at 5: 05Welcome para o Instituto de Pesquisa Digital e Educação Stata Textbook Exemplos Análise de Regressão Aplicada por John Fox Capítulo 16: Avaliando Amostragem Variação: Bootstrapping e Validação Cruzada O primeiro exemplo é de renda de quatro casais do quadro 16.1 . Primeiro, criamos um conjunto de dados de quatro variáveis ​​com 256 observações da tabela 16.2 usando o comando cross. Em seguida, usamos o comando egen para gerar uma variável com a média em cada linha. Figura 16.1, página 498. O segundo exemplo de 10 casais é baseado na Tabela 16.3, página 499. Primeiro, criamos um conjunto de dados baseado na Tabela 16.3. Em seguida, executamos o bootstrap do Stata bootstrap para obter uma estimativa de bootstrap da nossa estatística. Salvamos o resultado de um arquivo de dados chamado bmean. Em seguida, usamos bmean para representar graficamente o gráfico de freqüência (figura 16.2). Regressão Bootstrapping usando o arquivo de dados duncan. Os resultados abaixo são diferentes da tabela 16.5 desde que o procedimento de regressão robusto em Stata muda de Huber para biweight durante o cálculo. Figura 16.3 (a), página 508. Intervalo de confiança utilizado quando baseado nas estimativas de percentis. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site particular, livro ou produto de software pela Universidade da Califórnia. Bem-vindo ao Instituto de Pesquisa Digital e Educação Stata FAQ Como faço para escrever o meu próprio programa bootstrap Stata Tem a característica conveniente de ter um comando de prefixo bootstrap que pode ser perfeitamente incorporado com comandos de estimativa (eg regressão logística ou regressão OLS) e comandos sem estimativa (por exemplo, resumir). O comando bootstrap automatiza o processo de inicialização para a estatística de interesse e calcula as medidas de resumo relevantes (ou seja, os intervalos de polarização e de confiança). Por mais conveniente que este comando seja, no entanto, existem casos em que a estatística que você deseja inicializar não funciona dentro do comando. Para essas instâncias, você precisa escrever seu próprio programa bootstrap. Esta Stata FAQ mostra como escrever o seu próprio programa bootstrap. Para o primeiro exemplo, nós combinamos os resultados do comando bootstrap com os resultados de escrever um programa bootstrap. Idealmente, isso deve revelar como é simples escrever seu próprio programa bootstrap. Isto é seguido por um exemplo no qual a estatística que você deseja inicializar não funciona no comando bootstrap e, portanto, requer que você escreva seu próprio programa bootstrap. Exemplo 1 Neste exemplo, usamos o comando bootstrap e replicamos os resultados escrevendo nosso próprio programa bootstrap. Utilizamos o conjunto de dados da High School e Beyond, a partir do qual vamos regredir sexo (feminino), pontuação de matemática (matemática), pontuação de escrita (write) e status socioeconômico (ses) na pontuação de leitura (read) e bootstrap Erro quadrado (rmse). Para o bootstrap fazemos 100 repetições e especificamos a semente para que possamos replicar os resultados. Escrever nosso próprio programa bootstrap requer quatro etapas. No primeiro passo, obtemos estimativas iniciais e armazenamos os resultados em uma matriz, digamos observar. Além disso, devemos também observar o número de observações utilizadas na análise. Essas informações serão usadas quando resumirmos os resultados do bootstrap. Em segundo lugar, escrevemos um programa que vamos chamar de myboot que amostras os dados com a substituição e retorna a estatística de interesse. Nesta etapa, começamos por preservar os dados com o comando preserve, então pegue uma amostra de bootstrap com bsample. Bsample amostras os dados na memória com substituição, que é o elemento essencial do bootstrap. A partir da amostra de bootstrap, executamos nosso modelo de regressão e exibimos a estatística de interesse com o comando scalar de retorno. Note que quando definimos o programa, o programa define myboot. Nós especificamos a opção rclass sem essa opção, não seríamos capazes de produzir a estatística bootstrapped. Myboot conclui com o comando restore, que retorna os dados para o estado original (antes da amostra bootstrapped). Na terceira etapa, usamos o comando simular prefixo junto com myboot. Que coleta a estatística da amostra bootstrapped. Especificamos a semente eo número de repetições nesta etapa, que coincidem com as do exemplo acima. Finalmente, usamos o comando bstat para resumir os resultados. Incluímos as estimativas iniciais, armazenadas na matriz observada. E o tamanho da amostra com as opções stat () e n (), respectivamente. Os resultados do passo 4 correspondem aos resultados do comando bootstrap no exemplo acima. Exemplo 2 Neste exemplo, escrevemos um programa bootstrap onde o comando bootstrap usual não acomoda a estatística que queremos inicializar. A razão pela qual o comando bootstrap não acomoda todas as situações é porque o comando bootstrap requer uma estatística que cai diretamente do comando quotanalysisquot. Para ver quais estatísticas são acomodadas, use o comando ereturn list ou return list seguindo o comando quotanalysisquot. A distinção entre lista ereturn ou lista de retorno depende se o comando quotanalysisquot é um comando de estimativa ou não. Suponha que desejamos inicializar o fator de inflação de variância (vif), o que requer que rodamos regress e depois estat vif. Em tal situação, a estatística para o bootstrap cai de um comando de pós-estimativa, que não é obtido por regressar e, portanto, não é acomodado pelo comando bootstrap. Portanto, devemos escrever nosso próprio programa de bootstrap para obter uma estimativa de bootstrap do vif. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico pela Universidade da Califórnia.

Comments