• Colunistas

    Monday, 06-May-2024 20:59:27 -03
    Sérgio Rodrigues

    Google no século 19? O 'big data' que ilumina é o mesmo que confunde

    02/03/2017 02h00

    Kimihiro Hoshino - 28.jun.2012/AFP
    Pessoas são vistas na empresa Google, durante conferência anunal da empresa, em San Francisco, Estados Unidos. *** A Google logo is seen through windows of Moscone Center in San Francisco during Google's annual developer conference, Google I/O, in San Francisco on June 28, 2012 in California. AFP PHOTO / Kimihiro Hoshino
    Visita à sede do Google, em São Francisco (EUA), durante conferência anual da empresa

    O uso de ferramentas de "big data" nos estudos linguísticos abre tantas possibilidades de pesquisa ainda pouco exploradas no Brasil que nem precisa de defesa. Por que a língua seria exceção se praticamente todos os campos do saber vêm sendo revirados por esse tsunami?

    Para quem não está familiarizado com a ideia, "big data" (ou "megadados", em tradução correta, mas pouco usada) é o nome que se dá aos conjuntos gigantescos de informação que o mundo digital permite reunir e analisar com velocidade impensável até pouco tempo atrás.

    O desafio reside no fato de que esses dados são uma massa a princípio ininteligível que pode levar a iluminações ou a armadilhas, dependendo do recorte, dos critérios, da análise que se faça. A curiosa história do nome da maior empresa da era "big data", Google, ilustra tanto a oportunidade quanto o risco. Já chegaremos a ela.

    Primeiro vale partir do degrau mais intuitivo e elementar. Há muitos anos, antes de ouvir falar em "big data", comecei a recorrer ao Google para avaliar a frequência aproximada de certas expressões no português do Brasil. No meu livro "Viva a Língua Brasileira!" consta, por exemplo, que entre "poço do elevador" e "fosso do elevador" nossa preferência pelo primeiro fica na proporção de dois para um.

    Do emprego rudimentar ao mais complexo, análises quantitativas são só um instrumento. Seu valor vai depender do uso que delas se fizer. O italiano Franco Moretti, pioneiro em sua aplicação aos estudos literários, extraiu resultados instigantes da ideia de ver a literatura "de longe", processando grandes massas de texto em busca de padrões -o oposto da leitura microscópica do "close reading".

    O mesmo recurso, usado com menos critério, rendeu recentemente um "estudo comparativo" de ritmo entre grandes escritores brasileiros, com base no número de palavras por frase, que ilumina suas obras com a força de uma lâmpada queimada.

    Mas vamos à história de "Google". Contada na página da empresa, a origem da palavra é manjada. Nos anos 1930, o matemático americano Edward Kasner pediu a um sobrinho de 9 anos que batizasse o imenso número 10 elevado à centésima potência. O menino saiu-se com "googol". O que os fundadores do Google fizeram em 1997, ao registrar seu primeiro domínio, foi pegar essa palavra e alterar-lhe a grafia.

    Há poucos anos, graças a uma pesquisa feita justamente no Google Books por um curioso, veio à tona que o termo "google" podia ser encontrado em livros do seculo 19 -algumas décadas antes de nascer o número "googol", portanto, e já com a grafia que viraria marca registrada! Mas como? Quer dizer que o Google mentiu e foi desmascarado por sua própria ferramenta?

    Não exatamente. Passando da vista "de longe" para a de perto, descobrimos que aqueles "googles" precoces são quase todos variantes -talvez provocadas por erros de composição- de "goggle", isto é, "arregalar os olhos". Há também registros mais raros de "google" como onomatopeia de gorgolejo ou fala infantil, o que joga uma luz nova sobre a criação de "googol" por uma criança.

    Muito curioso, sem dúvida. Só não faz sentido imaginar que a turma do Google tivesse nada disso em mente ao escolher seu nome. Como ninguém ignora, o risco de ver tudo "de longe" é o de não enxergar direito.

    sérgio rodrigues

    É jornalista e escritor, publicou "Viva a língua brasileira!" (Cia. das Letras), em 2016.
    Escreve às quintas.

    Edição impressa

    Fale com a Redação - leitor@grupofolha.com.br

    Problemas no aplicativo? - novasplataformas@grupofolha.com.br

    Publicidade

    Folha de S.Paulo 2024