GitHub Copilot pode levar a Microsoft a enfrentar ações por direitos autorais

GitHub Copilot pode levar a Microsoft a enfrentar ações por direitos autorais
github copilot

O GitHub Copilot é uma ferramenta de auto-sugestão de programação treinada a partir de código-fonte público na internet. No entanto, ao que parece, ele está gerando código protegido por direitos autorais. Sendo assim, o GitHub Copilot pode levar a Microsoft a enfrentar ações por direitos autorais.

Nesta semana, Matthew Butterick, advogado, designer e desenvolvedor, anunciou que está trabalhando com o Joseph Saveri Law Firm para investigar a possibilidade de registrar um pedido de direitos autorais contra o GitHub. Existem duas possíveis linhas de ataque aqui: o GitHub está treinando indevidamente o Copilot em código aberto e a ferramenta está emitindo indevidamente o trabalho protegido por direitos autorais de outras pessoas. Isso seria extraído dos dados de treinamento.

Butterick tem criticado o Copilot desde o seu lançamento. Em junho, ele publicou um post no blog argumentando que “qualquer código gerado pelo Copilot pode conter licenças ocultas ou violações de propriedade intelectual” e, portanto, deve ser evitado.

Nesse mesmo mês, Denver Gingerich e Bradley Kuhn, da Software Freedom Conservancy (SFC), disseram que sua organização deixaria de usar o GitHub, em grande parte como resultado da Microsoft e do GitHub lançarem o Copilot sem abordar preocupações sobre como o modelo de aprendizado de máquina lidava com diferentes softwares de código aberto. requisitos de licenciamento.

Muitos desenvolvedores estão preocupados com o que o Copilot significa para código aberto.

GitHub Copilot pode levar a Microsoft a enfrentar ações por direitos autorais

A capacidade do Copilot de copiar o código literalmente, ou quase isso, surgiu na semana passada quando Tim Davis, professor de ciência da computação e engenharia da Texas A&M University, descobriu que o Copilot , quando solicitado, reproduziria seu código de transposição de matriz esparsa protegido por direitos autorais.

Solicitado a comentar, Davis disse que preferiria esperar até receber uma resposta do GitHub e de sua controladora, a Microsoft, sobre suas preocupações.

“Claramente, muitos desenvolvedores estão preocupados com o que o Copilot significa para código aberto”, escreveu ele. “Estamos ouvindo muitas histórias. Nossa experiência com o Copilot foi semelhante ao que outros descobriram – que não é difícil induzir o Copilot a emitir código literal de repositórios de código aberto identificáveis. À medida que expandimos nossa investigação, esperamos ver mais exemplos.

“Mas lembre-se de que a cópia literal é apenas um dos muitos problemas apresentados pelo Copilot. Por exemplo, os direitos autorais de um autor de software em seu código podem ser violados sem a cópia literal. Além disso, a maioria dos códigos abertos é coberta por uma licença, que impõe requisitos legais adicionais. O Copilot atendeu a esses requisitos? Estamos analisando todos esses problemas.”

Os porta-vozes da Microsoft e do GitHub não comentaram. No entanto, a documentação do GitHub para o Copilot avisa que a saída pode conter “padrões indesejáveis” e coloca o ônus da violação de propriedade intelectual no usuário do Copilot. Ou seja, se você usar o Copilot para completar o código automaticamente para você e for processado, você foi avisado. Esse aviso implica que o potencial do Copilot para produzir código protegido por direitos autorais não era imprevisto.

‘Ansioso’

Quando o GitHub introduziu uma versão beta do Copilot em 2021, e foram levantadas questões sobre direitos autorais e licenciamento, o então CEO Nat Friedman opinou “treinar sistemas de ML em dados públicos é uso justo [e] a saída pertence ao operador, assim como com um Compilador. Esperamos que IP e IA sejam uma discussão política interessante em todo o mundo nos próximos anos, e estamos ansiosos para participar!”

Essa participação, aliás, incluiu painéis de discussão financiados pelo GitHub sobre o impacto da IA no código aberto, em um evento organizado pela Open Source Initiative, que é parcialmente financiada pela Microsoft.

Kuhn, do SFC, disse que as declarações do agora ex-CEO do GitHub de que essas questões de direitos autorais são leis estabelecidas criam uma narrativa falsa – um ponto que ele fez anteriormente.

“Falamos com a Microsoft e o GitHub várias vezes sobre esse problema e sua posição anti-FOSS [software livre e de código aberto] não suportada permaneceu perturbadoramente consistente”, escreveu ele. “Acreditamos que a Microsoft e o GitHub fizeram o cálculo político de que, se continuarem repetindo que o que estão fazendo é aceitável, cedo e frequentemente, eles podem tornar verdade o que não é conhecido como verdade”.

No entanto, entre aqueles que consideram úteis ferramentas como o Copilot, há esperança de que a IA assistida possa funcionar com nossas estruturas sociais e legais. Que a saída de um modelo não levará a litígios.