Mais de 60 anos atrás, em sua série Fundação, o escritor de ficção científica Isaac Asimov inventou a psico-história, que combinava matemática e psicologia, para prever o futuro.
Hoje, os cientistas sociais tentam garimpar os vastos recursos da internet --pesquisas na web e mensagens do Twitter, postagens no Facebook e em blogs, pistas de localização digital geradas por bilhões de telefones celulares-- para fazer a mesma coisa.
Os pesquisadores mais otimistas acreditam que os "grandes dados" desses estoques vão revelar pela primeira vez as leis sociológicas do comportamento humano, permitindo que eles prevejam crises políticas, revoluções e outras formas de instabilidade.
"Este é um importante passo adiante", disse Thomas Malone, diretor do MIT (Instituto de Tecnologia de Massachusetts). "Temos à disposição tipos de dados mais detalhados e mais ricos, assim como algoritmos de previsão, o que possibilita um tipo de previsão que antes era impensável."
O governo americano está demonstrando interesse. Neste verão, uma agência pouco conhecida --a Atividade de Projetos de Pesquisa Avançada de Inteligência, ou Iarpa na sigla em inglês, que faz parte do gabinete do diretor da inteligência nacional-- começou a procurar ideias de cientistas sociais acadêmicos e corporações sobre maneiras de se rastrear automaticamente a internet em 21 países latino-americanos atrás de "grandes dados".
O sistema de coleta de dados automático se concentrará em padrões de comunicação, consumo e movimento das populações. Ele vai usar dados publicamente acessíveis, que incluem pesquisas na web, entradas em blogs, fluxo de tráfego na internet, indicadores do mercado financeiro, webcams de trânsito e alterações em verbetes da Wikipédia
Ele pretende ser um sistema totalmente automatizado, um "olho para dados no céu" sem intervenção humana, segundo a proposta do programa. A pesquisa também exploraria a capacidade de prever epidemias e outros tipos de contaminação generalizada.
Para um crítico, o projeto evoca memórias de um programa do Pentágono pós-11 de Setembro para caçar potenciais ameaças, identificando padrões em acervos de dados públicos e privados.
"Por um lado é compreensível que um país queira rastrear coisas como o aparecimento de uma pandemia, mas devo me perguntar sobre a automatização total disso e o quê de produtivo sairá dele", disse David Price, que escreveu sobre cooperação entre cientistas sociais e agências de inteligência.
Um projeto semelhante da Agência de Projetos de Pesquisa Avançada de Defesa, ou Darpa, pretende identificar automaticamente redes sociais insurgentes no Afeganistão.
No ano passado, pesquisadores do HP Labs usaram dados do Twitter para prever com precisão as receitas de bilheterias de filmes de Hollywood. Em agosto, a Fundação Nacional de Ciências em Arlington, Virgínia, aprovou verbas para pesquisa usando mídias sociais como Twitter e Facebook para avaliar danos de terremotos.
"Os grandes dados permitem ir além da inferência e da importância estatística e avançar para análises mais significativas e precisas", disse Norman Nie, um desenvolvedor de instrumentos estatísticos para cientistas sociais.
Os cientistas sociais que operam com as agências de pesquisa afirmam que, no balanço, as novas tecnologias terão um efeito sobretudo positivo.
"O resultado será uma compreensão melhor do que acontece no mundo e como os governos locais estão lidando com a situação", disse Sandy Pentland, um cientista do Laboratório de Mídia do MIT. "Eu acho tudo isso muito esperançoso, mais que assustador, porque esta talvez seja a primeira oportunidade real de toda a humanidade ter transparência de governo."
Os defensores da privacidade se preocupam. "Essas técnicas têm dois lados", disse Marc Rotenberg, presidente do Centro de Informação de Privacidade Eletrônica em Washington. "Podem ser usadas com a mesma facilidade contra adversários políticos nos Estados Unidos e contra ameaças de países estrangeiros."
Mas Prabhakar Raghavan, diretor do Yahoo! Labs e especialista em obtenção de informação, notou que prever epidemias de gripe examinando buscas na web pela palavra "gripe" não melhorou significativamente a informação já existente sobre um surto.
Outros pesquisadores são mais otimistas. "Existe uma enorme quantidade de poder de previsão nesses dados", disse Albert-Laszlo Barabasi, um físico especializado em ciência de redes.
"Se eu tiver dados hora a hora de sua localização, posso prever com 93% de precisão onde você estará uma hora ou um dia depois."