Projeto FLoC do Google fracassa por falta de privacidade

Projeto FLoC do Google fracassa por falta de privacidade
Projeto FLoC do Google fracassa por falta de privacidade

Os planos do Google de criar um novo mecanismo de anúncios parece ter falhado feio. De acordo com cientistas da computação do MIT Media Lab, o recurso vem sem o principal ingrediente da promessa: a privacidade.

FLoC significa Federated Learning of Cohorts. Ele consiste em um código de computador projetado para fornecer anúncios baseados em interesses dos usuários. No entanto, a promessa era um grande desafio de ter isso sem ferir a privacidade como ocorre no modelo empregado atualmente.

“O FLoC fornece um mecanismo de preservação de privacidade para seleção de anúncios com base em interesses”, explica Sam Dutton, defensor do desenvolvedor do Google Chrome, no site web.dev do Google.

Era para ter sido uma das várias tecnologias dentro do que o Google chama de “The Privacy Sandbox“. É uma iniciativa “para criar tecnologias que protegem a privacidade das pessoas on-line e fornecem às empresas e desenvolvedores ferramentas para construir negócios digitais prósperos”.

Como uma alternativa ao atual cenário infernal de privacidade – em que sites e seus scripts de rastreamento incorporados podem identificar visitantes, saber quais sites eles visitaram e exibir anúncios vinculados a todos os tipos de características e condições pessoais – o FLoC teve como objetivo agregar os visitantes do site em grupos chamados de coortes. Essas coortes corresponderam a várias categorias de interesse derivadas dos históricos de navegação das pessoas, mas sem tornar essas pessoas identificáveis ??ou expor seus históricos de navegação.

Em teoria, os sites que implementam o FLoC podem enviar o número de identificação de coorte de um visitante para um servidor de anúncios e buscar um anúncio que provavelmente se alinhe com o comportamento de navegação anterior do visitante sem poder supor a identidade do visitante.

Como o FLoC funcionou

Projeto FLoC do Google fracassa por falta de privacidade
Projeto FLoC do Google fracassa por falta de privacidade.

Mas o FLoC mal conseguiu decolar. Após o commit inicial do código em agosto de 2019 e o teste do navegador Chrome no início de 2021, o Google permitiu que seu experimento expirasse sem renovação em julho de 2021, para fazer alterações não especificadas. Então, em janeiro de 2022, o Google dispersou o FLoC e o substituiu por outro esquema de anúncios baseado em interesses, também ostensivamente preservador de privacidade, chamado Topics API.

Destemido por fabricantes de navegadores rivais como Apple, Brave e Mozilla, ou grupos de defesa como a Electronic Frontier Foundation, que questionaram tanto os motivos do Google quanto sua tecnologia, o Google continua repetindo a palavra “privacidade” em conexão com sua pilha de adtech ainda experimental.

No entanto, em um recente trabalho de pesquisa intitulado “Limitações de privacidade da publicidade baseada em interesse na Web: uma análise empírica post-mortem do FLoC do Google”, os doutorandos do MIT Media Lab, Alex Berke e Dan Calacci, argumentam que o FLoC falhou em fornecer privacidade e colocou informações pessoais em risco.

Projeto FLoC do Google fracassa por falta de privacidade

Os defensores da privacidade expressaram essas preocupações sobre o FLoC quando ele estava sendo testado. Mas o Google nunca revelou como seus testes foram, deixando os observadores se perguntando sobre os resultados. Então Berke e Calacci decidiram investigar.

Os dois acadêmicos começaram a implementar o FLoC usando o código-fonte aberto disponível. Eles calcularam coortes – grupos de interesse – para usuários com base em um conjunto de dados de mais de 90.000 dispositivos de cerca de 50.000 residências nos EUA, complementados por dados demográficos dessas residências.

Sua análise indicou que os críticos do FLoC foram diretos e especulam que os problemas de privacidade do FLoC foram o que levou o Google a trocar o FLoC pela API Topics.

Primeiro, ao contrário de seus objetivos principais, o FLoC permite o rastreamento de usuários individuais em todos os sites, afirma o documento. 

Descobrimos que mais de 95 por cento dos dispositivos de usuários são identificáveis ??exclusivamente após apenas quatro semanas. Mostramos então como essas estimativas são extremamente conservadoras e que esse risco aumenta com o uso de métodos comuns de impressão digital de dispositivos.

No entanto, o FLoC tem méritos 

Os pesquisadores observam que, embora haja uma relação entre dados demográficos sensíveis do usuário, como raça e renda e comportamento de navegação, o algoritmo FLoC que eles testaram não agrupou usuários em coortes com base em raça ou renda. Isso conta para alguma coisa.

Berke e Calacci argumentam que aqueles que desenvolvem esse tipo de tecnologia devem publicar ferramentas, conjuntos de dados de amostra e código – como fizeram – para permitir que outros pesquisadores testem quaisquer afirmações que estejam sendo feitas.

O Google cancelou o FLoC em favor de uma nova abordagem (Tópicos), que é um passo mais preservador da privacidade na direção da publicidade baseada em conteúdo contextual, explica o jornal. 

No entanto, como o FLoC, ele ainda tem como premissa rastrear os comportamentos de navegação dos usuários e trabalhos futuros precisarão demonstrar que essa nova abordagem vai longe o suficiente para preservar a privacidade do usuário. 

Via TheRegister