Google e DeepMind são acusados de 'roubar a internet' para criar chatbot Bard AI

google-paga-r-452-milhoes-para-resolver-processo-de-rastreamento-do-android-na-california

Google, DeepMind e a empresa-mãe, Alphabet, foram acusados de “roubar secretamente tudo o que já foi criado e compartilhado na internet por centenas de milhões de americanos” para construir seu próprio chatbot de IA, o Bard. A polêmica veio junto com a chegada do Bard ao Brasil.

Oito pessoas – incluindo dois menores, de 13 e 6 anos – estão tentando liderar milhões de internautas em um esforço de ação coletiva alegando 10 acusações contra a resposta da Alphabet ao ChatGPT da OpenAI, entre outros itens do “conjunto de produtos de IA” do Google.

A queixa foi apresentada em um tribunal federal da Califórnia e alega que a empresa violou várias leis estaduais e federais dos EUA, incluindo o DMCA, a lei de concorrência desleal da Califórnia e uma regra estadual de invasão de privacidade. Ele também acusa o fabricante de Bard de furto/recebimento de propriedade roubada.

O processo [PDF] fez questão de observar a atualização recente do Google de sua política de privacidade, confirmando que extrai dados públicos da Internet para treinar seus modelos e serviços de IA – incluindo a Bard e seus produtos hospedados na nuvem. O processo alega que a mudança foi feita em resposta ao aviso da FTC de que: “O aprendizado de máquina não é desculpa para infringir a lei… Os dados que você usa para melhorar seus algoritmos devem ser coletados legalmente… as empresas fariam bem em prestar atenção a esta lição.”

Google e DeepMind são acusados ??de 'roubar a internet' para criar chatbot Bard AI

Google e DeepMind são acusados de ‘roubar a internet’ para criar chatbot Bard AI

A alegação dos queixosos não identificados é que a “atualização” da política de privacidade online do Google foi uma duplicação efetiva de sua posição.

A notícia vem logo após processos semelhantes acusando a OpenAI, apoiada pela Microsoft, de violações de privacidade e uso indevido de dados copiados, bem como de violação de direitos autorais .

Como a ação coletiva da Microsoft e da OpenAI movida em junho, o processo de ontem também verifica os artigos da Reg – duas vezes – ao se aprofundar no lado técnico das questões. A primeira vez é para explicar como o imenso conjunto de dados C4 público do Google ingere material para construir seus sistemas de aprendizado de máquina de última geração. A segunda menção é para aprofundar seu argumento de que o Google lucra com os dados, destacando nossa cobertura de abril da apresentação interna do Google intitulada “Anúncios com tecnologia AI 2023”, descrevendo o plano do Google de lançar ferramentas generativas de IA em sua plataforma de publicidade.

A DeepMind, ainda comandada pelo cofundador Demis Hassabis após ser adquirida pelo Google em 2014 , é citada na ação por seu trabalho no desenvolvimento do Modelo de Linguagem para Aplicações de Diálogo (LaMDA), considerado fundamental no desenvolvimento de Bard e de outras empresas do Google produtos de IA.

O processo alega que os movimentos do Google violam os direitos de privacidade e direitos de propriedade, alegando:

Recentemente, veio à tona que o Google tem se apoderado secretamente de tudo o que já foi criado e compartilhado na Internet por centenas de milhões de americanos. O Google pegou todas as nossas informações pessoais e profissionais, nossos trabalhos criativos e autorais, nossas fotografias e até mesmo nossos e-mails – praticamente a totalidade de nossa pegada digital – e está usando para criar produtos comerciais de Inteligência Artificial (IA) como “Bard”, o chatbot que o Google lançou recentemente para competir com o “ChatGPT” da OpenAI. Durante anos, o Google coletou esses dados em segredo, sem aviso ou consentimento de ninguém.

Os demandantes estão buscando pelo menos US$ 5 bilhões, medidas cautelares e implementação de “salvaguardas eficazes de segurança cibernética” para proteger os titulares dos dados.

Em um comunicado, a conselheira geral do Google, Halimah DeLaine Prado, disse que a empresa tem “claro há anos que usamos dados de fontes públicas – como informações publicadas na web aberta e conjuntos de dados públicos – para treinar os modelos de IA por trás de serviços como o Google Tradutor, de forma responsável e de acordo com nossos Princípios de IA.”

Ela acrescentou: “A lei americana apóia o uso de informações públicas para criar novos usos benéficos e esperamos refutar essas alegações infundadas”.