Uma investigação exclusiva revela que o Instagram dá prioridade às fotografias de homens e mulheres com pouca roupa, moldando o comportamento dos criadores de conteúdo e a visão de mundo de 140 milhões de europeus no que permanece um ponto cego nos regulamentos da UE.

Sarah (o nome foi alterado) é uma empreendedora da alimentação numa grande cidade europeia. A empresa que ela criou ajuda as mulheres a sentirem-se à vontade com a ingestão de alimentos e defende a “alimentação intuitiva”. Como muitos proprietários de pequenas empresas, Sarah confia nos media sociais para atrair clientes. O Instagram, a segunda maior rede social da Europa após o Facebook, é um canal de marketing de que não podia prescindir, referiu.

Mas no Instagram, fortemente orientado para fotos e vídeos, ela sentiu que as suas fotos não alcançavam muitos dos seus 53 mil seguidores, a menos que posasse em roupas de banho. De facto, em quatro dos seus sete “posts” com mais “likes” nos últimos meses ela estava de biquíni. Ely Killeuse, autora de livros com 132 mil seguidores no Instagram, disse que “quase todas” das suas fotos com mais “likes” exibiam-na em roupas íntimas ou de banho.

Pode ser que o público prefira massivamente Sarah e Ely em trajes de banho. Mas, desde o início de 2016, o Instagram organiza as imagens no “feed” de notícias de um utilizador para que as fotos com as quais ele “mais se importa apareçam na parte superior do ‘feed’”. Se as outras fotos postadas por Sarah e Ely forem menos populares, pode ocorrer que não sejam mostradas aos seus seguidores.

Quais fotos são mostradas e quais não são, não é apenas uma questão de gosto. Os empresários que dependem do Instagram para adquirir clientes devem adoptar as normas que o serviço incentiva para alcançarem os seus seguidores. Mesmo que essas normas não reflictam os valores em que construíram os seus negócios ou os do seu público-alvo e clientes.

2.400 fotos analisadas
Para entender quais as fotos a que o Instagram dá prioridade, a European Data Journalism Network e o AlgorithmWatch pediram a 26 voluntários para instalar um “add-on” do browser e seguir uma selecção de criadores de conteúdo profissionais. Seleccionámos 37 profissionais de 12 países (14 deles homens) que usam o Instagram para anunciar marcas ou adquirir novos clientes para os seus negócios, principalmente nos sectores da alimentação, viagens, fitness, moda ou beleza.

O “add-on” abre automaticamente a página inicial do Instagram em intervalos regulares e observa quais os “posts” que aparecem no topo dos “feeds” de notícias dos voluntários, fornecendo uma visão geral do que as plataformas consideram ser mais relevante para cada voluntário.

Se o Instagram não mexer no algoritmo, a diversidade de “posts” no “feed” de notícias dos utilizadores deve corresponder à diversidade dos “posts” feitos pelos criadores de conteúdos que eles seguem. E se o Instagram personalizou o “feed” de notícias de cada utilizador de acordo com os seus gostos pessoais, a diversidade de “posts” nos seus “feeds” de notícias deve ser distorcida de maneira diferente para cada utilizador. Não foi isso que descobrimos.

Entre Fevereiro e Maio, foram analisados 1.737 “posts” publicados pelos criadores de conteúdo que monitorizámos, contendo 2.400 fotos. Dessas, 362 (ou 21%) foram reconhecidas por um programa de computador como contendo fotos mostrando mulheres de biquíni ou roupa íntima, ou homens de peito nu. Nos “feeds” de notícias dos nossos voluntários, no entanto, os “posts” com essas imagens representavam 30% de todos os mostrados nas mesmas contas (alguns “posts” foram exibidos mais de uma vez).

Os “posts” com fotos de mulheres em roupas íntimas ou biquini tinham 54% mais chances de aparecer no “feed” de notícias dos nossos voluntários. Os “posts” com fotos de homens em peito nu tinham 28% mais hipóteses de serem exibidos. Por outro lado, os “posts” que mostram fotos de comida ou de paisagem eram 60% menos prováveis ​​de serem exibidas no “feed” de notícias.

Esses resultados, que podem ser lidos em detalhe numa página dedicada, passam nos testes padrão de significância estatística.

À espera de uma auditoria
A inclinação para a nudez pode não se aplicar a todos os utilizadores do Instagram. Embora fosse consistente e aparente para a maioria dos voluntários, uma pequena minoria recebeu publicações que reflectiam melhor a diversidade publicada pelos criadores de conteúdo. É provável que o algoritmo do Instagram seja a favor da nudez em geral, mas a personalização ou outros factores limitam esse efeito para alguns utilizadores.

Os nossos resultados ficam aquém de uma auditoria abrangente ao algoritmo de “feed” de notícias do Instagram. Eles documentam apenas o que aconteceu nos “posts” dos nossos voluntários. (Pode ajudar-nos a melhorar os resultados instalando o “add-on“, que publicaremos actualizações à medida que chegarem mais dados.) Sem acesso aos dados internos e servidores de produção do Facebook, a empresa que administra o Instagram, será sempre impossível tirar conclusões definitivas.

O Facebook não respondeu às nossas questões, mas enviou uma declaração: “Esta pesquisa tem falhas de várias maneiras e mostra um mal-entendido de como o Instagram funciona. Classificamos os ‘posts’ no seu ‘feed’ com base no conteúdo e nas contas nas quais demonstrou interesse, e não em factores arbitrários, como a presença de roupas de banho”.

No entanto, temos motivos para acreditar que as nossas descobertas são representativas de como o Instagram geralmente opera.

Maximizar o envolvimento
Numa patente publicada em 2015, os engenheiros do Facebook explicaram como o “feed” de notícias poderia seleccionar quais as fotos a terem prioridade. Quando um utilizador publica uma imagem, ela é analisada automaticamente de imediato, segundo a patente. As imagens recebem uma “métrica de envolvimento”, usada para decidir se deve ou não mostrar a imagem no “feed” de notícias do utilizador.

A métrica de envolvimento é parcialmente baseada no comportamento passado do utilizador. Se um utilizador gostou de uma marca específica e uma foto mostra um produto da mesma marca, a métrica de envolvimento aumenta. Mas esta métrica também pode ser calculada com base no comportamento passado de todos os utilizadores do serviço. A patente afirma especificamente que o sexo, etnia e “estado de nudez” das pessoas numa foto podem ser usados ​​para calcular a métrica de envolvimento.

Embora o Instagram afirme que o “feed” é organizado de acordo com o que um determinado utilizador “se preocupa mais”, a patente da empresa explica que ele pode realmente ser classificado de acordo com o que pensa que todos os utilizadores se importam. O facto de os utilizadores verem ou não as fotos nas contas que seguem depende não apenas do seu comportamento passado, mas também do que o Instagram acredita ser mais atraente para outros utilizadores da plataforma.

Correlações espúrias
O Facebook analisa automaticamente as fotos com um software, conhecido como visão computacional, antes que o seu algoritmo decida quais serão exibidas no “feed” de um utilizador. Esse software extrai inferências automatizadas de um conjunto de dados treinados, composto por milhares de imagens anotadas manualmente. As suas limitações podem afectar a maneira como o Instagram hierarquiza as imagens nos “feeds”.

Os cientistas da computação sabem há anos que esses sistemas replicam e ampliam os enviesamentos dos seus dados de treino, levando a correlações espúrias ou falaciosas. Por exemplo, um programa encarregado de identificar lobos e cães com base em imagens dos caninos encontrados online não reconhecerá os animais no sentido humano da palavra. Em vez disso, dará o rótulo de “lobo” a qualquer animal num fundo de neve.

Os dados de treino para a visão computacional são geralmente produzidos por trabalhadores mal remunerados, com um incentivo para trabalhar rapidamente e fornecer resultados que atendam às expectativas dos seus empregadores. Isso leva-os a adoptar acriticamente as categorias que lhes mostram e a ignorar as subtilezas que uma foto pode conter, escreveu Agathe Balayn, candidata a PhD na Delft University of Technology sobre o enviesamento em sistemas automatizados.

As consequências podem ser graves. Em Dezembro, um artista brasileiro tentou anunciar um dos seus “posts” do Instagram. O pedido foi negado com o argumento de conter conteúdo violento. Representava apenas um garoto e o piloto de Fórmula 1 Lewis Hamilton – ambos de pele escura. Em Abril, uma professora de ioga viu um anúncio negado porque a imagem seria profana, quando estava apenas a fazer uma pose. Ela é asiático-americana.

(Na nossa configuração experimental, também usámos um sistema de visão computacional, o Google Vision. Embora os seus resultados sejam notórios – o rótulo “beleza”, por exemplo, só foi considerado para as mulheres – é muito provável que os seus enviesamentos sejam semelhantes ao sistema do Facebook, até porque foi desenvolvido em parte pelas mesmas pessoas.)

Uma linha fina a seguir
As directrizes do Instagram afirmam que a nudez não é permitida no serviço, mas favorece os “posts” que mostram a pele. A diferença subtil entre o que é encorajado e o que é proibido é decidida por algoritmos de visão computacional não auditados e provavelmente tendenciosos. Em qualquer vez que mostram uma foto, os criadores de conteúdos devem encadear essa linha muito fina entre revelar o suficiente para alcançar os seus seguidores, mas não revelar tanto que sejam expulsos da plataforma.

Um inquérito em 2019 a 128 utilizadores do Instagram feito pela revista americana Salty mostrou que a remoção abusiva de conteúdo era comum. O quão comum essas ocorrências são e se as pessoas de cor e as mulheres são desproporcionalmente afectadas é impossível de dize, enquanto os algoritmos do Instagram permanecerem sem ser auditados.

No entanto, uma análise a 238 patentes registadas pelo Facebook contendo a frase “visão computacional” mostrou que, das 340 pessoas listadas como inventoras, apenas 27 eram do sexo feminino. Os ambientes dominados por homens geralmente levam a resultados prejudiciais para as mulheres. Os cintos de segurança nos carros, por exemplo, são testados apenas em manequins masculinos, levando a taxas mais altas de lesões para as mulheres. A nossa investigação mostra que os algoritmos do Facebook podem seguir esse padrão.

Receios de “shadow-ban”
Sarah e outros empresários que dependem do Instagram ficaram aterrorizados ao falar com a imprensa. A maioria dos criadores de conteúdo profissional do Instagram teme retaliações do Facebook, na forma de exclusão da conta ou proibições “shadow-ban” (uma prática em que os “posts” de utilizador não são mostrados ou são a muito poucos dos seus seguidores, sem o conhecimento do utilizador) – uma sentença de morte para os seus negócios.

Uma jovem empreendedora com cerca de 70 mil seguidores, disse que o Instagram era “muito importante” para os seus negócios e referiu especificamente ao AlgorithmWatch que não queria ser nomeada por medo de uma “shadow-ban”. Já Ely Killeuse afirmou que ter outra fonte de rendimento era a “condição número um” para ela. A dependência em excesso do Instagram significaria perder a sua liberdade e sanidade, acrescentou.

O Regulamento Geral de Proteção de Dados (RGPD), que entrou em vigor em 2018, e a regulação Platforms to Business (P2B), que será aplicável a partir de 12 de Julho de 2020, já fornecem muitas garantias para utilizadores e profissionais. Em particular, o RGPD afirma que os utilizadores têm um “direito à explicação” sobre decisões automatizadas, e o regulamento P2B forçará os serviços de intermediação online a divulgar os “principais parâmetros que determinam a classificação [algorítmica]”.

Esta nova medida não deve forçar as plataformas a divulgar o funcionamento interno dos seus algoritmos, de acordo com Petra de Sutter, que preside à Comissão do Mercado Interno e Protecção do Consumidor no Parlamento Europeu. Impedir que o Instagram classifique os “feeds” dos seus utilizadores não seria legalmente viável, escreveu por email para o AlgorithmWatch. Em vez disso, a transparência que o P2B trará deve permitir decisões políticas bem informadas posteriormente, acrescentou. Quanto aos temores dos “shadow-bans”, de Sutter considera-os exagerados. “Uma pergunta nunca trouxe retaliação”, escreveu.

O P2B pode ser diferente, mas dois anos após a entrada em vigor do RGPD, vários especialistas lamentam uma implementação muito lacunarizada. Um problema é que a autoridade irlandesa de proteção de dados, responsável pela regulamentação da subsidiária europeia do Facebook em Dublin, parece estar com uma escassez de pessoal e “não entender o RGPD”, como um especialista destas plataformas explicou ao AlgorithmWatch. Outra questão está na falta de policiamento. Nenhuma autoridade, ao nível europeu ou dentro dos Estados-Membros, tem o poder ou as ferramentas necessárias para auditar qualquer uma das plataformas gigantes, incluindo o Instagram, deixando muitas das disposições do RGPD sem aplicação.

Possível discriminação
Embora os nossos resultados mostrem que os criadores de conteúdo masculinos e femininos são forçados a mostrar a pele de maneiras semelhantes se quiserem alcançar o seu público, o efeito pode ser maior para as mulheres e ser considerado uma discriminação para as mulheres empreendedoras. No entanto, embora a discriminação de género seja proibida pela Carta dos Direitos Fundamentais da União Europeia, não existem vias legais para um utilizador do Instagram iniciar processos legais. As especificidades do empreendedorismo em media sociais não são tidas em conta na legislação.

Miriam Kullmann, professora assistente da WU Vienna University of Economics and Business, escreveu ao AlgorithmWatch como a legislação europeia contra a discriminação lida quase exclusivamente com relações de trabalho. Os trabalhadores independentes, como os profissionais que monitorizámos, não são protegidos.

Alguns grupos lutam pelos direitos de criadores independentes nos media sociais. O IG Metall, o maior sindicato da Europa, apoia uma acção colectiva de YouTubers a exigir mais justiça e transparência da Google (dona do YouTube) quando um vídeo é desmonetizado. Eles não planeiam alargar o seu programa a criadores de conteúdo no Instagram ou noutras plataformas.

Um em cada três europeus a usar
Com o número de empreendedores europeus a criar conteúdo no Instagram provavelmente a atingir vários milhares, o impacto dos seus “posts” é enorme, pois eles costumam ter centenas de milhar de seguidores. O Facebook afirma que cerca de 140 milhões de residentes da União Europeia, ou um em cada três, usaram o Instagram em Abril.

Entre as pessoas de 18 a 24 anos, a penetração do Instagram é de cerca de 100% em todos os países da UE. As ordens de confinamento vinculadas à pandemia do Covid-19 aumentaram o tempo gasto no Instagram em quantidades surpreendentes. Numa semana na Itália fechada, as visualizações do Instagram duplicaram em relação ao normal, informou o Facebook aos investidores.

Um quarto próprio
Há quase um século, a famosa autora britânica Virginia Woolf disse que as mulheres precisavam de “um quarto próprio” para permitir que a sua criatividade florescesse. Adiar a opinião de autoridades externas, escreveu ela, era como convidar a podridão a desenvolver-se no centro do trabalho de alguém.

No Instagram, adiar a opinião das autoridades que criaram o algoritmo do “feed” não é uma escolha. Recusar-se a mostrar partes do corpo reduz drasticamente o público. Empresários do sexo masculino e feminino devem cumprir as regras estabelecidas pelos engenheiros do Facebook, se quiserem ter a chance de ganhar a vida.

* Texto original publicado por EDJNet/Algorithm Watch (CC BY 4.0). Foto: Lalo Hernandez.