• Ciência

    Monday, 29-Apr-2024 09:53:06 -03

    Ativistas correm para salvar dados científicos do governo dos EUA

    DO "NEW YORK TIMES"

    20/03/2017 02h00

    Quando a posse do novo presidente dos Estados Unidos estava se aproximando, em janeiro, a sensação entre alguns cientistas que dependem de vastos oceanos de dados armazenados em servidores do governo era quase de pânico. As informações pelas quais eles temiam abarcavam grande número de categorias, de dados sociodemográficos a fotos da calota polar obtidas por satélites.

    Em um governo Trump que já havia deixado claro o seu desdém pelas copiosas provas de que a atividade humana está causando o aquecimento do planeta, os pesquisadores temiam uma ampla cruzada contra as informações científicas fornecidas ao público.

    O anúncio de fortes cortes no orçamento da Agência de Proteção Ambiental (EPA) alimentou temores renovados de que bancos de dados inteiros sejam destruídos, nem que apenas como resultado de cortes de despesas.

    "Provavelmente estaremos nos despedindo de muitos dos dados inestimáveis armazenados nos NCEI", afirmou Anne Jefferson, professora de hidrologia aquática na Universidade Estadual Kent, em post no Twitter sábado, usando a sigla dos Centros Nacionais de Informação Ambiental norte-americanos.

    É ilegal destruir dados do governo, mas agências podem dificultar o acesso a eles ao revisar sites e criar outras barreiras para o uso das informações brutas armazenadas.

    Já houve algumas mudanças nos sites de agências federais de ciência, de acordo com a Iniciativa de Governança e Dados Ambientais, uma nova organização de pesquisadores que monitoram o conteúdo dos bancos de dados públicos.

    No site da EPA, por exemplo, a seção de ciência e tecnologia antes descrevia sua missão como o desenvolvimento "de fundações científicas e tecnológicas para a obtenção de água limpa". Agora, ela diz que seu objetivo é desenvolver "padrões de desempenho tecnológica e cientificamente atingíveis".

    Gráficos no site do Departamento de Energia que ilustravam a conexão entre a queima de carvão e as emissões de gases causadores do efeito-estufa também foram removidos. O mesmo vale para a descrição de uma página no site do Departamento do Interior sobre os efeitos ambientais do uso de técnicas de fratura hidráulica para exploração petroleira em terras federais.

    Mudanças como essas parecem refletir apenas as prioridades declaradas pelo novo governo, e existem poucos sinais até agora de que bancos de dados federais estejam sendo sistematicamente manipulados ou restringidos.

    Mas a preocupação quanto à vulnerabilidade de informações científicas também atraiu atenção para um problema de governo na era digital que independe de preferências partidárias. Boa parte das informações científicas minuciosamente recolhidas ao longo de décadas, a um custo de centenas de bilhões de dólares, continua a estar sob controle exclusivo do governo, dispersas por milhares de servidores e centenas de departamentos, onde os dados talvez não contem com backup e nos quais encontrá-los pode ser difícil.

    Milhares de acadêmicos, bibliotecários, programadores de software e cidadãos interessados em causas científicas se reuniram, nas últimas semanas, em eventos de "resgate de dados" –seis deles aconteceram só no último fim de semana –e a enormidade da tarefa de extrair dados governamentais hoje facilmente acessíveis se tornou aparente; o mesmo se aplica à dificuldade de localizar dados menos acessíveis.

    Alguns ativistas pela causa do acesso aberto a dados se referem a "dados ocultos" –e eles não estão falando sobre informações sigilosas ou informações que o governo só costuma divulgar se houver uma solicitação de informações específicas nos termos da Lei de Liberdade de Informação.

    "É como a matéria escura - sabemos que ela deve estar lá, mas não sabemos onde encontrá-la para confirmar", disse Maxwell Ogden, diretor da Code for Science and Society, uma uma organização sem fins lucrativos que iniciou um projeto de criação de arquivos para os dados governamentais usando os sistemas da Universidade da Califórnia.

    "Se eles pretendem apagar alguma coisa, como é que nós poderemos saber que dados foram apagados, se nem mesmo sabemos que eles estavam lá?", ele questionou.

    Os obstáculos causaram debate entre os ativistas que lutam por acesso aberto aos dados sobre como criar um sistema de arquivo para os dados científicos do governo que garanta que o público não perca acesso a eles, não importa quem esteja no poder.

    "Ninguém advogaria um sistema no qual o governo armazena todos os dados científicos e nós simplesmente confiamos em que as autoridades os forneçam a nós", disse Laurie Allen, bibliotecária digital da Universidade da Pensilvânia e uma das fundadoras da Data Refuge. "Não era esse o sistema que imaginávamos ter, mas é o sistema que temos".

    No momento, o que existe de mais próximo a um repositório central de dados é o Data.gov, que sob uma diretiva do governo Obama em 2013 tem a missão de oferecer links para todos os bancos de dados públicos operados pelo governo. Mas o sistema depende de que as agências encaminhem links ao sistema por conta própria, e a dimensão total dos dados a que o sistema fornece links, Ogden descobriu recentemente, é de apenas 40 terabytes - um volume que poderia ser armazenado em discos rígidos que custariam no máximo US$ 1 mil.

    A Administração Nacional da Aeronáutica e Espaço (Nasa) oferece acesso a mais de 17,5 petabytes de dados arquivados, de acordo com o seu site (um petabyte é mil vezes maior que um terabyte), por meio de dezenas de portais.

    E um terço dos links do Data.gov, Ogden descobriu, conduzem os usuários a um site e não aos dados em si, o que torna mais difícil desenvolver software que os copie automaticamente.

    Mesmo os bancos de dados que constam do Data.gov –e há mais de dois milhões deles, de acordo com os registros de Ogden –muitas vezes são acessíveis por meio de uma interface criada para facilitar o acesso, mas em geral baseada em códigos de computação fechados e quase impossíveis de reproduzir.

    A necessidade de escrever códigos especializados para extrair dados, digamos, dos relatórios da EPA sobre emissões de poluentes, é uma razão para que, a despeito de ter organizado mais de duas dúzias de eventos de "resgate de dados" desde janeiro, o grupo ativista Data Refuge ofereça acesso a apenas 158 conjuntos de dados em seu diretório público.

    Andrew Bergman, aluno de pós-graduação em física aplicada na Universidade Harvard, e dois de seus colegas no departamento de física suspenderam seus estudos a fim de fundar a Iniciativa de Governança e Dados Ambientais, que também participa da organização dos eventos.

    "Temos coisas que são consideradas realmente importantes, da Nasa, EPA, Noaa", disse Bergman. "Mas em termos de conjuntos de dados completos e totalmente extraídos, o que temos é muito pouco comparado ao total".

    A transição para a distribuição digital que tornou os documentos do governo mais acessíveis, dizem os bibliotecários, também os expõe a mais riscos. Sem cópias físicas em bibliotecas, a promessa da Internet, de tornar mais acessíveis os dados do governo, os centralizou muito mais.

    Exceto nos casos em que determinados dados são objeto de um pedido de acesso nos termos da Lei de Liberdade de Informação ou tema de processos judiciais, não está claro o que compeliria uma agência do governo a mantê-los online.

    "Destruir registros federais é crime", disse Patrice McDermott, que comanda uma organização ativista chamada Open the Government. "Mas tirá-los da Internet não acarreta a mesma penalidade".

    Em carta recente ao Serviço de Administração e Orçamento do governo federal, a organização de McDermott mencionou uma cláusula na Lei de Redução da Burocracia de 1995 que requer que agências "ofereçam notificação adequada quando criarem, modificarem substancialmente ou encerrarem esforços de disseminação de informações".

    Mas o que isso significa, na era do big data, não está claro.

    Produzir cópias seguras de pesquisas financiadas pelo governo nas quais os pesquisadores possam confiar não é tarefa fácil, dizem os bibliotecários. Mas muitos daqueles que vêm tentando há anos obter verbas e criar um sistema para fazê-lo confiavelmente esperam aproveitar a atual onda de interesse.

    "No momento, o número de pessoas cientes do risco de confiar apenas no governo para preservar as informações das quais elas dependem é maior do que nunca", escreveram dois bibliotecários que estudam documentos do governo, James A. Jacobs, da Universidade da Califórnia em San Diego, e James R. Jacobs, da Universidade Stanford, em um artigo que foi veiculado online na semana passada. "Isso não acontecia seis meses atrás, por exemplo".

    Nos eventos de preservação de arquivos, os participantes costumam ser divididos em grupos. Um desses grupos usa uma extensão de navegador de Internet para encaminhar endereços de Web do governo ao Internet Archive, um serviço existente que opera um agente de software automatizado capaz de copiar sites federais mas que em geral não tem acesso a bancos de dados que armazenem informações em formatos mais exóticos.

    Outro grupo tem a tarefa de vasculhar os conjuntos de dados que os pesquisadores identificam como especialmente úteis ou vulneráveis. Esses bancos de dados recebem um tag que descreve sua origem e o que eles contêm.

    Em um dos eventos, na Universidade de Nova York em fevereiro, muita gente ficou espantada com a amplitude e profundidade das pesquisas que estavam sendo examinadas, e ao mesmo tempo passou a se preocupar ainda mais com o futuro dos dados.

    "Veja, você pode obter leituras de temperatura e salinidade de qualquer dessas boias", disse Barbara Thiers, vice-presidente de ciência do Jardim Botânico de Nova York, outra participante dos eventos. "Esses são os dados brutos para acompanhar o aquecimento do oceano".


    Tradução de PAULO MIGLIACCI

    Edição impressa
    [an error occurred while processing this directive]

    Fale com a Redação - leitor@grupofolha.com.br

    Problemas no aplicativo? - novasplataformas@grupofolha.com.br

    Publicidade

    Folha de S.Paulo 2024