GitHub sela cofre do Ártico com última adição: informações da Wikipedia e Stack Overflow

Saiba como evitar a ação de milhares de malwares no GitHub em arquivos PoC falsos

Nas profundezas de uma montanha do Ártico, mais perto do Pólo Norte do que do Círculo Ártico, em uma câmara segura e reforçada dentro de uma mina de carvão desativada, repousam 188 rolos de filme de arquivo endurecido, cada um individualmente selado contra a devastação do tempo. Codificado nesses rolos está uma captura de imagem de cada repositório público ativo no GitHub a partir de 02/02/2020, o trabalho coletivo de quase quatro milhões de pessoas desenvolvedoras. Este é o Arctic Code Vault (Cofre de Códigos do Ártico, em tradução livre) do GitHub. GitHub sela cofre do Ártico com última adição: informações da Wikipedia e Stack Overflow.

O propósito do Programa Arquivo do GitHub é preservar o software open source, sendo um pilar oculto da civilização moderna e herança compartilhada de toda a humanidade para as gerações futuras. O objetivo, segundo o GitHub, é protegê-lo por mil anos, o que é extremamente ambicioso. Afinal, poucas, se é que alguma, das empresas de tecnologia de hoje ainda existirão daqui a um século ou dois.

Mil anos é muito tempo

GitHub sela cofre do Ártico com última adição: informações da Wikipedia e Stack Overflow
GitHub sela cofre do Ártico com última adição: informações da Wikipedia e Stack Overflow.

A título de comparação, muitas ruínas que nós consideramos inimaginavelmente antigas, como Angkor Wat, Grande Zimbábue e Machu Picchu, ainda não tinham sido construídas há mil anos. A questão não se trata apenas se os compilados de arquivos que foram depositados há dois anos sobreviverão fisicamente, mas se alguém saberá ou se importará o suficiente para mantê-los e consultá-los. Por isso, sua importância precisa ser visualmente significativa. Por esse motivo, Alexander Rose, Diretor Executivo da Long Now Foundation, parceira do GitHub, disse com naturalidade: “Se você não o tornar bonito, com certeza está condenado”. 

É por essa razão que os compilados “Maiores Sucessos”, para parceiros institucionais, foram colocados em estojos com qualidade de museu e o motivo também de terem instalado um enorme cofre de aço, gravado com impressionante arte gerada por IA criada pelo artista Alex Maki-Jokela, dentro do Arquivo Mundial do Ártico. 

GitHub sela cofre do Ártico com última adição: informações da Wikipedia e Stack Overflow

O Arctic Code Vault do GitHub agora é um cofre literal, com rolos de filme de arquivo descansando com segurança em uma estrutura de cerca de 1400 kg. E mesmo que as gerações futuras, daqui a muitos séculos, não saibam o que é, elas certamente reconhecerão que é algo extraordinário.

Cofre de Códigos Ártico do GitHub. Créditos: Divulgação. Caixa de Arquivos Open Source do GitHub, criada pelo artista Alex Maki-Jokela. Créditos: Divulgação

O propósito do Cofre

Não é difícil que surja o questionamento: o que o GitHub espera que esses herdeiros façam com isso, exatamente? Mas há muitos propósitos práticos plausíveis. Uma quantidade preocupante de conhecimento do mundo está atualmente armazenada em mídia efêmera: discos rígidos, CD-ROMs que duram algumas décadas, com fitas de backup com vida útil de 30 anos. É fácil imaginar cenários em que surge uma necessidade inesperada de software de outra forma perdido para apodrecer, como a busca por projetos de Saturno V desativados após o desastre do ônibus espacial Challenger.

Além disso, também é muito considerado que o valor do arquivo seja histórico, porque já funciona como uma espécie de cápsula do tempo pré-pandemia – em apenas dois anos, o “normal” de 2020 já mudou bastante. Futuros historiadores podem considerar a era de onipresença de código aberto, comunidades voluntárias e a Lei de Moore como importância histórica, e essa é uma das razões pelas quais as capturas de imagens de 02/02/2020 foram tão amplas e democráticas. 

Assim como a historiadora e autora de ficção científica, Ada Palmer, explicou, embora tenham muitas cartas escritas pelos aristocratas ricos da Renascença, o que os historiadores modernos que sobreviveram realmente gostariam são as listas de compras das pessoas comuns. Por isso, a esperança é que armazenando e indexando milhões de repositórios, o GitHub tenha capturado uma valiosa seção transversal do mundo do software moderno.

A Tech Tree

Claro que o mundo não começa e termina com software. De fato, o próprio conceito pode ser estranho aos herdeiros do arquivo. É por isso que o GitHub também reuniu, arquivou e agora depositou no Cofre de Códigos Ártico, o que chamou de “Tech Tree”. Embora cada compilado de arquivos já contenha um guia legível por humanos, em cinco idiomas diferentes, descrevendo o arquivo e seu conteúdo, a Tech Tree é uma seleção de trabalhos, mais legíveis por humanos, em vez de codificados, que fornecem um contexto muito mais amplo.

A Tech Tree descreve como o mundo cria e usa software hoje, juntamente com uma visão geral dos próprios computadores e suas tecnologias fundamentais. Inclui também uma pequena seleção de obras artísticas, culturais e históricas, como contexto cultural; uma bobina do texto completo da Wikipedia, em todos os cinco idiomas do arquivo (árabe, chinês, inglês, hindi, espanhol); e, claro, um dump de dados completo do Stack Overflow, afinal, por que não?

De olho no futuro

Com a instalação do cofre de aço no Arquivo Mundial do Ártico, o depósito da Tech Tree, as parcerias de “warm backups” com o Internet Archive e Software Heritage, e os compilados “Melhores Momentos” protegidos em três bibliotecas de renome mundial em três continentes, a versão 1.0 do Programa de Arquivos do GitHub conseguiu atingir todos os seus objetivos. No entanto, a empresa ainda não vai descansar sobre os louros do arquivamento, já que o Programa Arquivo é um esforço contínuo e ainda pretende anunciar futuras iniciativas.