Mineração de Dados - Parte 1

Você já parou para se perguntar como é que os bancos e financeiras em geral sabem quando houve uma possível fraude em um cartão de crédito? Como que seguradoras desenvolvem complexos sistemas para dizer que você, estudante e solteiro é de um grupo de maior risco? Afinal de contas, nem sempre todos os problemas são precedidos por uma grande explicação teórica. Nesses e em alguns outros exemplos é preciso fazer com que os dados “te digam” algo e obviamente eles não farão isso sozinhos. Mas, como você fará isso? Mineração de dados!

A mineração de dados representa um conjunto de técnicas de extração de informações e processos para investigar relacionamentos entre variáveis a partir de uma grande quantidade de dados. Nesse sentido, o objetivo da mineração de dados é obter padrões, anomalias (lembra da fraude no cartão?) e regras possibilitando a conversão de dados geralmente não perceptíveis em instrumento para tomada de decisão gerando conhecimento e produzindo modelos preditivos.

Vou desenvolver uma série de artigos explicando como você poderá utilizar esta técnica na Ciência Política. Como o assunto é longo e absolutamente fascinante, preciso lhe que a Mineração tem três etapas importantes: a exploração inicial; a identificação do modelo e o desenvolvimento.

1.Coleta

 

Na exploração inicial acontece a preparação dos dados para a análise. Nessa fase ocorre a limpeza, transformação ou seleção das informações. Fase de muito trabalho, de coleta de informações, de averiguação se os dados estão certos. Muito trabalho “braçal” aqui!

 

 

2. Identificação do modelo

Na segunda etapa, é onde se escolhe o modelo a partir da capacidade preditiva que ele apresenta. Ou seja, muita tentativa e erro. Nesta fase, é importante você já ter um conhecimento grande sobre a sua base de dados e sobre os seus dados.

 

 

 

Etapa 3.  desenvolvimento

Na última etapa, o modelo é aplicado visando facilitar a tomada de decisão. Sim, depois de tanto trabalho, você precisará explicar e aplicar o seu modelo. E aí você vai descobrir se ele realmente funciona par alguma coisa.

 

 

 

As diversas técnicas que compreendem o processo de mineração subsidiam a compreensão automática ou semiautomática através de algoritmos de aprendizagem. As principais técnicas são: descoberta de regras de associação; árvores de decisão; raciocínio baseado em casos; algoritmos genéticos e redes neurais artificiais. No âmbito da Ciência Política a mineração possibilita, entre outras coisas, interpretar o comportamento legislativo, o desempenho do governo, como, também pode ser aplicada para controlar e predizer efeitos de políticas públicas.

A imagem aqui demonstra como seria um processo de mineração sobre a atuação parlamentar.

 

No video, demonstro como você vai começar a desenvolver a etapa 1 do processo de Mineração de Dados com bases do Tribunal Superior Eleitoral do Brasil (TSE). O Software utilizado é o Modeler, da IBM.

 

Críticas e sugestões são sempre bem-vindas! Você pode utilizar o espaço aqui em baixo.

 

Thiago Sampaio


Fatal error: Uncaught Exception: 12: REST API is deprecated for versions v2.1 and higher (12) thrown in /home/storage/4/6f/c7/pesquisamaconica/public_html/metodologiapolitica/wp-content/plugins/seo-facebook-comments/facebook/base_facebook.php on line 1273