Archive for the 'R' Category

Encontrando variáveis repetidas em múltiplas bases de dados

MultiplosEm meu último texto  comentei sobre como automatizar a importação de várias bases de dados de um diretório diretamente para o R. Hoje, eu quero esticar essa conversa adicionando outros desafios: agora eu quero de saber quais variáveis existem nas bases de dados antes mesmo de começar a trabalhar nelas. Evidentemente, eu não gostaria de obter essa informação lendo todos os livros de códigos, caso haja algum.

Continue lendo... “Encontrando variáveis repetidas em múltiplas bases de dados” »

Importando múltiplas bases de dados com R

arquivosem um sóQuem nunca enfrentou aquela pasta em seu computador cheia de arquivos de texto para serem transformadas em uma só base de dados? Sim. Todo mundo por aqui já teve esse dilema ou é muito provável que um dia vá enfrentar algo semelhante.

Durante os dias de festa eu finalmente achei inspiração para lidar com todas aquelas bases de dados sobre do Tribunal Superior Eleitoral. A causa de minha relutância em por minhas mãos em tais  bases era simplesmente o de evitar problemas com arquivos grandes e mal-arranjados de puro "txt". De fato, parece que não tem como escapar de problemas de codificação e malformação de arquivos de textos. Quanto maior o arquivo, maiores as chances de conter problemas com caracteres, delimitação dos campos e etc.

Continue lendo... “Importando múltiplas bases de dados com R” »

Como importar os microdados do Censo da Educação Superior no R

ineprTentando solucionar a dúvida de um leitor que postou um comentário aqui no Metodologia Política, me deparei com uma situação nova, de fácil solução, mas que pode dar um pouco de dor de cabeça até descobrir o caminho das pedras. Trata-se de um problema de encode com os dados do Censo da Educação Superior.

Como o INEP disponibiliza os dados do Censo da Educação Superior com dicionários para o SPSS e para o SAS, tentei importar esses dados utilizando as funções; fwf2csv() desenvolvida por Marcos F. Silva, parse.SAScii() e read.SAScii.sqlite() desenvolvidas por Anthony Damico, e todas retornavam uma mensagem de erro.

Continue lendo... “Como importar os microdados do Censo da Educação Superior no R” »

Microdados no R - Parte 2

Dando continuidade na análise de grandes bases de dados, este post utilizará os conhecimentos obtidos no post Microdados no R - parte 1 para criar tabelas com os dados do censo demográfico para os anos de 2000 e 2010. A maior curva de aprendizado que deve ser superada para trabalhar com os dados do censo esta relacionada a capacidade computacional de trabalhar com milhões de linhas. Acreditamos que a partir do primeiro post e desdequalquer pessoa com conhecimento mínimo em R pode trabalhar com bases de dados de milhões de linhas, utilizando seu computador pessoal.

Veja o vídeo Trabalhar com Microdados usando o R - parte 6

Baixe o código script.R.importar.microdados.v2.R

Dúvidas? Comentários?

 

Um abraço e até a próxima!

Roney Fraga

Microdados no R

microdadosrA disponibilidade de bases de dados cresce exponencialmente, enquanto a capacidade dos pesquisadores em Ciência Política em trata-las não acompanha o mesmo ritmo. Isso fez e tem feito com que muitos estudos e pesquisas sejam feitas com dados de outras pesquisas, que muitas vezes são de outras áreas. Afinal, quem nunca “pegou emprestado” uma tabela com alguns dados de um artigo interessante?  Pois bem, mas que tal aprender a trabalhar e a tratar as bases na sua origem? Ter a confiança, riqueza e a precisão que sua pesquisa merece?

O processo de entender e acessar essas bases de dados não é trivial, demanda um conhecimento mínimo de software estatístico e da organização dos arquivos que compõem as bases de dados. Este post é para aqueles que já conhecem o R (entenda) e pretende ajudar o leitor a acessar os microdados do IBGE e INEP. Se você está acostumado a trabalhar com o SPSS, clique aqui.

Continue lendo... “Microdados no R” »

A evolução na Ciência Política e na análise de dados: R

Para quase todo estudante de Ciência Política aprender a operar um software estatístico é quase por acaso. O primeiro professor de metodologia de pesquisa simplesmente aborda um software específico em aula e pronto. Se o contato com o software não foi traumático – o evolucaorque é para muita gente – o estudante aprenderá os fundamentos mínimos e eventualmente estudará mais sobre o software.  Dificilmente, contudo, se arriscará a mudar. Afinal, qualquer mudança exigirá mais tempo de dedicação.

Mas a realidade muda. Aquela ferramenta que você aprendeu a usar pode se tornar obsoleta. Na área de tecnologia as mudanças sã o muito rápidas. Pensando nisso, o Metodologia Política vai iniciar uma série de artigos, vídeo aulas e disponibilizará uma biblioteca gratuita sobre aquilo que consideramos um bom investimento intelectual para qualquer estudante com olhos no futuro: o R.

Acalme-se. O R não é um bicho papão, tampouco uma coisa de nerds ultra-mega-aficionados em estatística e análise de dados. Tenho certeza que, em breve, o R se tornará o seu melhor amigo.

Continue lendo... “A evolução na Ciência Política e na análise de dados: R” »

Como Gerar Mapas Utilizando o R e Maptools

Há alguma vantagem em trocar as tradicionais tabelas por gráficos? Eu diria que sim. Percebe-se uma tímida—mas gradativa—mudança no modelo de apresentação de resultados de pesquisa na Ciência Política. Muitos cientistas políticos estão priorizando gráficos às já obsoletas tabelas. Exemplos dessa tendência podem ser vistos em vários trabalhosrecentes, como em Terron e Soares (2010)[1] e Marcelino (2010)[2].Se você quiser ver mais argumentos sobre isso, veja em Kastellec e Leoni (2007)[3] e também em Brady (2011)[4].

De forma ainda mais contundente, o tema é abordado em “Ways of Knowing” por Moses e Knutsen (2007), os quais introduzem na discussão o argumento de que as ciências sociais por serem uma ciência  dividida também diverge na forma de apresentar os resultados. Estes autores, fazem opapel de "advogado do diabo" quando mostram que a Estatística não é uma ciência tão perversa assim como os construtivistas afirmam, e que os gráficos podem ser uma poderosa ferramenta para contextualizar a frieza dos números e aproximar ambos naturalistas e contrutivistas.

Continue lendo... “Como Gerar Mapas Utilizando o R e Maptools” »