Encontrando variáveis repetidas em múltiplas bases de dados

MultiplosEm meu último texto  comentei sobre como automatizar a importação de várias bases de dados de um diretório diretamente para o R. Hoje, eu quero esticar essa conversa adicionando outros desafios: agora eu quero de saber quais variáveis existem nas bases de dados antes mesmo de começar a trabalhar nelas. Evidentemente, eu não gostaria de obter essa informação lendo todos os livros de códigos, caso haja algum.

O que eu preciso, na verdade é um sumário, ou uma tabela simples que me informasse quais variáveis vou encontrar em "minhas" bases de dados. Portanto, acredito que esse post pode ser interessante para quem está trabalhando com ondas de surveys, uma vez que surveys tendem a repetir algumas questões, enquanto muda outras ao longo do tempo, ou lugar, pois o foco de pesquisa também se altera.

Existe um pacote do R chamado "SciencesPo" que tem uma função chamada "detail", a qual descreve---ou detalha---toda a base de dados de uma só vez sem desprezar a apresentação dos resultados: variáveis como linhas e estatísticas descritivas como colunas. Eu gosto disso porque no final não importa quantas variáveis eu tenho, a tabela produzida por "detail" pode se tornar extensa, mas não muito larga para se ajustar à tela do computador. Minha intenção portanto é obter uma matrix similar, todavia, com nomes das variáveis nas linhas e nomes dos banco de dados como colunas. Portanto, a tabela final me mostrará quais variáveis existem, e em quais bases de dados.

Finalmente, eu mostrarei como obter resultados similares usando dois pacotes estatísticos populares:  R e Stata. O script para replicação abaixo está dividido em duas partes. Na primeira, eu mostro como obter os dados de exemplo para replicar esse tutorial (vou usar a base de dados "seniors" que acompanha a licença do Stata). Na segunda, eu apresento uma rotina simples para obter o resultado, assim, se você já tiver alguns dados de ondas de survey, apenas a segunda parte do script pode ser interessante para você.

Procedimento no R :

tabela_R

 

Aqui é a vez do Stata: tabela_Stata 
O que acharam? Útil, não?

Abraços e até a próxima!


Fatal error: Uncaught Exception: 12: REST API is deprecated for versions v2.1 and higher (12) thrown in /home/storage/4/6f/c7/pesquisamaconica/public_html/metodologiapolitica/wp-content/plugins/seo-facebook-comments/facebook/base_facebook.php on line 1273