• Tec

    Thursday, 02-May-2024 10:32:04 -03

    'Big data' ajuda a compreender o mundo em que vivemos, diz pesquisador

    RODOLFO LUCENA
    DE SÃO PAULO

    07/04/2014 03h20

    A aventura de criar uma superlente digital capaz de bisbilhotar a produção intelectual dos últimos dois séculos. Essa é a história contada em "Uncharted: Big Data as a Lens on Human Culture" ("Não Mapeado: Big Data Como uma Lente Sobre a Cultura Humana"), escrito pela dupla de cientistas Erez Aiden e Jean-Baptiste Michel.

    Ambos são pesquisadores com interesses em múltiplas áreas. Aiden tem doutorados em matemática e engenharia biomédica, além de mestrado em história. Michel abandonou a academia e comanda sua própria empresa, que constrói aplicações com grandes quantidades de dados –tem mestrado em matemática e doutorado em biologia de sistemas.

    Os dois se conheceram em Harvard e descobriram o interesse comum de trabalhar com "big data". O objeto do estudo foi o Google Books, "uma biblioteca digital cujo objetivo era abranger todos os livros escritos". Resultado: o Ngram Viewer, apresentado em dezembro de 2010, buscador capaz de determinar a incidência de um termo e comparar seus registros em milhões de livros.

    Em "Uncharted", lançado em dezembro, Aiden e Michel comentam várias aplicações divertidas da ferramenta (books.google.com/ngrams ).

    Nesta entrevista, Michel conta mais sobre o trabalho.

    Kris Snibbe/Harvard Staff Photographer
    Michel (à frente) pesquisa em biblioteca de Harvard com seu colega Erez Aiden
    Michel (à frente) pesquisa em biblioteca de Harvard com seu colega Erez Aiden

    *

    Folha - Qual foi a maior descoberta ao trabalhar com os dados do Google Books?
    Jean-Baptiste Michel - Percebemos que o Google já tinha tantos livros digitalizados que poderíamos usar essa enorme base de dados para entender a evolução da humanidade. Vimos ser possível fazer estudos significativos da cultura e da sociedade usando ferramentas quantitativas como o Ngram Viewer.

    Para que ela serve?
    É uma ferramenta poderosa, capaz de processar questões usando uma base gigantesca de textos. O NGram Viewer é um objeto para a criatividade, para que você possa fazer novas perguntas... Eu não sou capaz de formular um milésimo, um milionésimo das perguntas que podem ser feitas, das pesquisas que podem ser realizadas nela.

    Em quantos de livros ele pesquisa?
    O Google Books tem cerca de 30 milhões de livros digitalizados. Quando lançamos o sistema e publicamos o primeiro estudo, eram cerca de 5 milhões de livros. Em 2012, o pessoal do Google atualizou a ferramenta, que hoje pesquisa em até 8 milhões.

    Por que não é possível pesquisar em português?
    Não há uma boa razão. Nós simplesmente usamos os idiomas nos quais tínhamos maior número de livros digitalizados e também os idiomas que nós entendíamos, com inglês, francês e espanhol. Depois, incluímos idiomas históricos, como aramaico e hebreu. Não há planos para incluir o português, mas eu acharia sensacional se pudéssemos fazer isso.

    Por que os senhores inventaram a palavra 'cultoromics', e o que ela significa?
    Já há algum tempo existe o que chamamos de linguística cultural, que acompanha as mudanças do uso de palavras, da forma como são escritas. Agora, temos uma quantidade de dados que nos permite fazer um novo tipo de pergunta. Podemos ir além do estudo do uso da linguagem, chegar às ideias que estão por baixo das mudanças, ver as mudanças e como elas acontecem. Para demonstrar isso, seria útil ter uma nova palavra. A que escolhemos é uma combinação de cultura e genômica. Então, não é uma mistura de cultura e economia, como as pessoas costumam pensar.

    Como o sr. define "big data"?
    Para mim, "big data" é quando você tem uma quantidade de dados que é da mesma ordem de grandeza do total de dados disponível naquele universo. Nós estimamos que hoje existam cerca de 130 milhões de livros publicados. Quando a gente fala de 8 milhões de livros, cerca de 6% do total, é um número grande o suficiente para perceber que está na mesma ordem de grandeza.

    Como o "big data" pode mudar as nossas vidas?
    É uma forma de medir coisas que não podia ser mensuradas antes; nesse sentido, é uma forma de construir muitos instrumentos que falem sobre a experiência humana: linguagem, cultura, sociedade... Isso vai ter um impacto em nossas vidas, pois vai nos ajudar a entender a coisa mais fundamental, que é como nós vivemos. E há outras aplicações mais quotidianas, da vida real, que é como big data permite criar coisas que mudam nossas vidas. O Google é um exemplo disso, você pesquisa bilhões de fontes em segundos; também o fato de as notícias se propagarem em segundos via internet é um exemplo de big data.

    Também pode ser usada para controlar a sociedade...
    Sim. É possível. "Big data" é uma tecnologia poderosa, transformadora. E como qualquer outra tecnologia, pode ser usada para o bem ou para o mal. Com a fissão nuclear, por exemplo, você tem o poder para o bem, que é a geração de energia, mas tem também o poder para o mal, que é a bomba. "Big data" é a mesma coisa, pode ser usada para o bem, para entender quem somos, as estruturas que se modificaram ao longo da história, para fazer nossa vida melhor e mais fácil. Se tivermos "big data" sobre nossa saúde, por exemplo, isso pode nos ajudar a entender melhor as coisas, e a curar mais rapidamente, ou ajudar a formular políticas públicas de saúde. Mas também tem as sementes, as raízes para produzir um estado policial.

    E não precisamos nem falar de um estado policial, as próprias empresas podem usar esses dados de forma que talvez os indivíduos não aprovassem. Você pode descobrir que algumas companhias sabem muito sobre você por causa de seu histórico de navegação ou por causa de algum "cookie" deixado em seu navegador.

    E como a sociedade pode evitar isso?
    Acho que da mesma maneira que já evitamos a guerra nuclear: por meio do diálogo, do conhecimento, da divulgação de informações. É preciso haver diálogo na humanidade, não estamos lá ainda, mas espero que tenhamos isso.

    *

    RAIO-X
    Jean-Baptiste Michel

    IDADE
    Nasceu em 1982, na França, filho de pai francês e mãe mauritana

    FORMAÇÃO
    Formou-se em matemática e em ciência da computação em Paris, em 2005, vivendo na França até os 25 anos. Concluiu mestrado em matemática aplicada e PhD em biologia em Harvard. Trabalhou no Google, e hoje mora em Nova York

    OCUPAÇÃO
    Dirige a Quantified Labs (quantifiedlabs.com), que criou em parceria com Thomas Annicq. Cocriador do books.google.com/ngrams e do livro "Uncharted"

    *

    "UNCHARTED: Big Data as a Lens on Human Culture"
    AUTORES Erez Aiden e Jean-Baptiste Miche
    QUANTO US$ 11,99 para Kindle
    ONDE Amazon.com

    Fale com a Redação - leitor@grupofolha.com.br

    Problemas no aplicativo? - novasplataformas@grupofolha.com.br

    Publicidade

    Folha de S.Paulo 2024