Vivemos tempos de crescente disponibilidade de dados primários para produção de análises científicas no campo da política. O desenvolvimento das tecnologias digitais, aliado à tendência de transparência dos órgãos públicos junto com as práticas de prestação pública de contas tem feito com que mais e mais informações sejam facilmente acessadas para posteriores análises.
Dadas as limitações de tempo de energia dos pesquisadores, podemos dizer que a disponibilidade de informações tende ao infinito. Então, por que fazer um curso sobre análises de dados categóricos a partir de fontes secundárias em tempos de big data? A resposta a essa pergunta deve ser dividida em duas partes.
Primeiro, porque a maior quantidade de dados disponíveis em fontes primárias não significa necessariamente melhor qualidade de informações. Muitas fontes de big data disponibilizam apenas relatórios com resultados sumarizados e não as bases de dados.
Não raras vezes o pesquisador tem que copilar informações de diferentes relatórios para formar seu próprio banco de dados. O pior acontece quando não é possível a compilação de informações de diferentes fontes e a pesquisa “estaciona”, ou melhor, “encalha” no imenso lamaçal de terabytes de informações disponíveis, mas inúteis.
Segundo, e principalmente, a utilização de dados secundários em análises nos permite cumprir uma das funções da pesquisa científica que tende a ser desconsiderada cada vez mais: a possibilidade de replicar dados para testar os resultados e os “achados” de outros pesquisadores.
Uma das funções menos exercitadas da pesquisa científica é justamente a de testar resultados obtidos em trabalhos anteriores com novos dados ou utilizando outras ferramentas analíticas.
Em tempos de big data isso é explicado pelo fato de sempre termos novas informações disponíveis para as atuais pesquisas. Parece que estamos sempre recomeçando a partir de novas informações, o que dificulta a realização de trabalhos que façam comparações com dados e resultados de pesquisas já desenvolvidas.
Seja para atualizar as conclusões anteriores, seja para questionar a validade de conclusões para a realidade atual.
O objetivo de Análise De Dados Categóricos Em Ciência Política é contribuir para a difusão de técnicas de pesquisa empírica aplicada à área da ciência política que, apesar de bastante simples, permitem uma notável diferença na qualidade das análises e conclusões a que chegam os cientistas políticos.
Análise De Dados Categóricos Em Ciência Política nasceu de um minicurso ministrado por mim a alunos de pós-graduação em Ciência Política da Universidade de Campinas no segundo semestre de 2013, a convite do professor Bruno Wilhelm Speck. Poucas mudanças foram feitas após o curso. De mais significativo houve apenas o acréscimo de um teste que não foi discutido naquela ocasião.