Programador encontra siglas obscenas escondidas nos títulos de artigos acadêmicos

Um programador resolveu examinar 32 milhões de títulos de artigos acadêmicos na tentativa de encontrar siglas obscenas ocultas. E, acreditem, ele encontrou algumas pérolas, que, podem ser apenas coincidência, ou em alguns casos, quem sabe, terem sido colocados de propósito.

@Fesshole é o nome de uma conta no Twitter, com mais de meio milhão de seguidores, que pede para você “confessar seus pecados anonimamente” e esperar que a Internet o absolva. Dois dias atrás, ‘confissões’ twittadas incluíam isso: “Quando publico trabalhos acadêmicos sérios de pesquisa, tento fazer com que as letras iniciais do título soem algo obsceno.”

Este fato chamou a atenção de Rob Manuel. No Reino Unido ele é conhecido como o cofundador do popular site B3ta, que existe há 21 anos e se descreve como uma “comunidade infantil de artes digitais”. Manuel também gosta de programar bots no Twitter, como @swearclock, que se dedica a twittar a hora enquanto insulta.

Siglas obscenas em títulos de trabalhos acadêmicos

Manuel é programador e afirma em um tweet, que está baixando um arquivo de 130 GB de títulos de trabalhos acadêmicos e se preparando para escrever “algum código capaz de detectar aqueles que formam siglas grosseiras”.

Imagem: Genbeta

Ele confessou que, apesar da demora para baixar o arquivo, certamente encontrará muitas siglas acidentais. “Provavelmente encontrarei alguns acidentais, eu acho. Veremos: baixar o arquivo leva uma eternidade, provavelmente mais do que levarei para escrever o código.”

No dia seguinte, outro tweet divulgou o andamento de seu projeto: o código (em Python) estava pronto e, de uma lista de 32 milhões de títulos de ‘papers’, extraídos do Unpaywall, ele havia criado (e postado no GitHub) uma segunda lista filtrando aquelas cujas siglas coincidem com os palavrões mais usados na língua inglesa.

A lista publicada

Esta segunda lista (com cerca de 80.000 resultados) indicava as correspondências, diferenciando-as entre ‘exata’ (a sigla coincide com um insulto), ‘próximo’ (uma única letra extra antes ou depois), ‘duplo’ (referências a dois insultos dentro um acrônimo mais amplo), ‘início’ (as primeiras letras de um acrônimo mais amplo correspondem a um insulto) e ‘talvez’ (opções mais improváveis). E com base nisso, agora Manuel recorreu à colaboração cidadã:

“O que eu gostaria que você fizesse é ler os resultados e escolher qualquer um que você acha que vale a pena destacar.”

E, de fato, entre as respostas fornecidas por vários usuários, eles detectaram coincidências que, na opinião deles, parecem ir além do mero acaso.

Veja algumas das siglas que o Genbeta disponibilizou, abaixo:

  • Sexual Hormones in the Pathophysiology of Tourette’s Syndrome” (Hormônios sexuais na fisiopatologia da síndrome de Tourette): ‘Shitpot’ é uma maneira vulgar de dizer vaso sanitário, mas também é uma maneira de dizer que alguém é uma merda;
  • Colo-Recto-Anal Physiology” (Fisiologia Colo-Reto-Anal): Crap ou Merda, literalmente;
  • Pressurized Irrigation System Selection” (Seleção do Sistema de Irrigação Pressurizada): Piss. Acho que isso conta como sistema de irrigação (Xixi).
  • Cloture Reform and Party Government in the Senate” (Reforma Cloture e Governo do Partido no Senado”: Crap Gits, ou idiota de merda.

Via: Genbeta

Share This Article
Follow:
Jardeson é Mestre em Tecnologia Agroalimentar e Licenciado em Ciências Agrária pela Universidade Federal da Paraíba. Entusiasta no mundo tecnológico, gosta de arquitetura e design gráfico. Economia, tecnologia e atualidade são focos de suas leituras diárias. Acredita que seu dia pode ser salvo por um vídeo engraçado.
Sair da versão mobile