Portugal vai ter nos próximos tempos um manancial de informação segmentada sobre a sua população. A informação dos Censos, anonimizada e agregada com outros dados, começará a ser divulgada esta semana e pode dar um retrato bastante fiel do país – se esses dados forem disponibilizados ao público e à academia.
O Dados.gov, o catálogo central de dados abertos da Administração Pública em Portugal, é um bom passo nessa direcção mas ainda falta muita informação, alguma dela nas mãos de entidades privadas.
Por exemplo, desconhecem-se os dados sobre os fluxos nos transportes (aviões, metropolitanos, autocarros urbanos, etc.) ou como obter dados sobre a mobilidade geográfica de quem tem telemóvel ou a geolocalização activada nestes dispositivos. As operadoras de telecomunicações têm estes dados.
O problema não é apenas nacional, explica a revista Nature. Por exemplo, quem quiser entender os padrões de mobilidade nos transportes de Sydney (Austrália) tem de “usar os dados espaciais e temporais de baixa qualidade criados quando os telemóveis procuram (“ping”) as torres celulares” mais próximas para efectivar as comunicações. Mas as operadoras vendem estes dados a preços elevados.
“O modelo actual, no qual os rastos digitais das nossas vidas são monopolizados pelas empresas, ameaça a capacidade da sociedade de produzir a investigação rigorosa e independente necessárias a enfrentar questões urgentes. Também restringe quais informações podem ser acedidas e as perguntas que podem ser feitas. Isso limita o progresso na compreensão de fenómenos complexos, desde como a cobertura da vacinação altera o comportamento até como os algoritmos influenciam a disseminação da desinformação”, refere-se.
Este modelo facilita um outro problema que passa pela escassez de certas perguntas que não podem ser feitas pelos investigadores.
No acesso aos dados, impõem-se restrições e há perguntas que não devem e não podem ser feitas (ou respondidas). Por exemplo, que tipo de analítica coloca as operadoras de telecomunicações sobre os conteúdos a que os seus clientes acedem em serviços como Netflix ou Spotify? Vendem esses dados, mesmo que anonimizados? E são guardados durante quanto tempo?
As dificuldades podem levar “os investigadores a sentirem-se pressionados a alinhar os seus estudos e resultados com os valores e prioridades das empresas de tecnologia. Descobertas desfavoráveis podem revogar o acesso aos dados, colocando em risco a continuidade do trabalho de um investigador e, potencialmente, também a sua posição na sua instituição e com os seus pares”.
Pode parecer extremo mas um relatório da equipa Responsible AI do Facebook, em Março, revelou como “os investigadores estavam restritos a tipos de problemas que podiam estudar e às soluções que podiam propor. Em vez de ser capaz de erradicar a desinformação e o discurso de ódio que contribuem para a aderência [à rede social], o trabalho deles teve que se concentrar em mudanças técnicas para enviesamentos nos sistemas”.
Barcelona tentou mudar isso com o Open Data BCN. Como o repositório português, procura armazenar “dados urbanos comuns”, devolvendo aos cidadãos algum controlo sobre os seus dados pessoais – que pode mesmo passar por uma diminuição na recolha do exagerado número de dados.
A Nature propõe ainda três abordagens aos decisores políticos e instituições científicas para transformar os dados num “bem público“: desenvolver uma infra-estrutura pública para garantir o armazenamento de grandes conjuntos de dados; definir políticas em que os dados criados e controlados por entidades privadas sejam transferidos para instituições públicas e, por fim, devem ser criadas instituições dedicadas (“data trusts”) a trabalhar os dados no interesse público, agrupando interesses multidisciplinares.
Um envolvimento necessário passa pelas autoridades de cibersegurança, como salienta o relatório “Data Brokers and Security“, do NATO Strategic Communications Centre of Excellence (NATO StratCom COE), que analisa como os dados acessíveis comercialmente podem ser explorados para questões de segurança junto de instituições militares.
A organização usa a definição de “data brokers” da Federal Trade Commission dos EUA, como sendo “empresas cujo negócio principal é recolher informações pessoais sobre consumidores de uma variedade de fontes e agregar, analisar e partilhar essas informações, ou informações derivadas delas, para fins como marketing de produtos, verificação de identidade de um indivíduo ou detecção de fraude”.
A NATO salienta vulnerabilidades como a abundância de dados nos “data brokers” que facilitam a criação de perfis pessoais, o armazenamento inseguro e guardado indefinidamente, a falta de controlo sobre venda e uso desses dados ou a falta de transparência, nomeadamente sobre o enevoado consentimento do utilizador.
Uma outra visão passa pela criação de um mercado europeu de partilha cívica de dados, com intermediários da exploração financeira de dados, ou ainda por coligações de dados que, numa visão do futuro para a actualidade, reconhece que “não diminuíram a qualidade dos serviços digitais, nem retardaram o progresso tecnológico. Pelo contrário, a concorrência aumentou e o sector de tecnologia como um todo está a prosperar. Hoje, qualquer empresário com uma boa ideia tem a mesma possibilidade de obter acesso a grandes conjuntos de dados como a Amazon e a Google. Os consumidores estão mais felizes e o discurso público é mais saudável. As coligações de dados ajudaram a sociedade a fazer exactamente o tipo de julgamentos inteligentes sobre a tecnologia e o interesse público que foi desastrosamente negligenciado nas duas décadas anteriores”, como escreve Matt Prewitt, presidente da RadicalxChange Foundation, em “Uma visão do futuro dos nossos dados: bem-vindo à era das coligações de dados” (em “O Estado da Internet 2021“).
Segundo o também co-autor do Data Freedom Act, “a era da coligação de dados não é uma tecno-utopia nem um sonho febril ludita. É simplesmente um novo acordo político-económico com uma síntese mais razoável de interesses concorrentes, melhores incentivos e uma concentração de poder menos alarmante em Silicon Valley”.