Você já reparou que as imagens subaquáticas tendem a ficar embaçadas e um pouco distorcidas? Isso ocorre porque fenômenos como atenuação e dispersão da luz afetam a visibilidade. Para remediar isso, os pesquisadores da Universidade de Engenharia de Harbin, na China, criaram um algoritmo de machine learning que gera imagens realistas da água, juntamente com um segundo algoritmo que treina essas imagens para restaurar a cor natural e reduzir a névoa. Eles dizem que sua abordagem corresponde qualitativa e quantitativamente ao estado da arte dessa área. Além disso, dizem que ela é capaz de processar mais de 125 quadros por segundo em execução em uma única placa gráfica. Neste artigo, veja como os pesquisadores usaram inteligência artificial (IA) para restaurar fotos subaquáticas com eficácia.
Inteligência Artificial que melhora fotos subaquáticas
A equipe observa que a maioria dos algoritmos de aprimoramento de imagem subaquática (como aqueles que ajustam o balanço de branco) não se baseiam em modelos de imagem física, tornando-os inadequados para a tarefa. Por outro lado, essa abordagem utiliza uma rede generativa de oposição, chamada GAN, para produzir um conjunto de imagens de locais específicos de pesquisa alimentados em um segundo algoritmo, chamado U-Net.
A equipe treinou a GAN em um conjunto de cenas rotuladas contendo 3.733 imagens de vieiras, pepinos do mar, ouriços do mar e outros organismos que vivem em fazendas marinhas internas. Além disso, eles adquiriram conjuntos de dados abertos, incluindo o NY Depth, que compreende milhares de fotografias subaquáticas.
Após o treinamento, os pesquisadores compararam os resultados de sua abordagem com outros métodos. Eles ressaltam que sua técnica tem vantagens, pois é uniforme na restauração de cores. Além disso, ela recupera bem as imagens em tons de verde sem destruir a estrutura subjacente da imagem de entrada original. Geralmente, ele também consegue recuperar cores, mantendo brilho e contraste “adequados”, uma tarefa na qual as soluções concorrentes não são particularmente adequadas.
Vale ressaltar que o método dos pesquisadores não é o primeiro a reconstruir quadros a partir de imagens danificadas. O DeepRay da Cambridge Consultants utiliza um GAN treinado em um conjunto de dados de 100.000 imagens estáticas para remover a distorção introduzida por um painel opaco de vidro. Além disso, o projeto DeOldify de código aberto emprega uma família de modelos de IA, incluindo GANs, para colorir e restaurar imagens antigas e filmagens . Ainda mais, os cientistas da Microsoft Research Asia, em setembro, detalharam um sistema completo para colorir autonomamente os vídeos; e o Google AI, em junho, introduziu um algoritmo que coloria vídeos em escala de cinza sem supervisão manual humana.
Fonte: Venture Beat