Inteligência artificial melhora fotos com pouca resolução

A utilização de inteligência artificial para a melhoria de imagens parece não ter limites. Uma série de pesquisas em softwares experimentais tem impressionado pela capacidade de aprimorar a resolução de fotografias de uma maneira que até então só parecia possível em séries policiais que vemos na TV.

O Let’s Enhance, um novo site que utiliza redes neurais para aprimorar fotografias, é um desses novos recursos. O serviço aprimora e elucida detalhes e texturas que faltam nas fotos. Mais recentemente, cientistas alemães anunciaram o desenvolvimento do EnhanceNet-PAT, um algorítimo que consegue recuperar a nitidez de imagens de forma assustadora.

Let’s Enhance

Let’s Enhance é um site que usa redes neurais para aprimorar fotos e foi projetado para ser minimalista e fácil de usar. A página inicial convida você a arrastar e soltar uma foto no centro. Uma vez que sua foto é recebida, a rede neural aprimora e elucida detalhes e texturas para que a foto pareça natural.

Toda vez que você carrega uma foto, 3 resultados são produzidos: o filtro Anti-JPEG simplesmente remove artefatos JPEG, o filtro Boring faz o upscaling, preservando detalhes e bordas existentes, e o filtro Magic desenha e alucina novos detalhes na foto que na verdade não estavam lá antes (usando IA).

Você terá que esperar alguns minutos para que o trabalho seja feito, mas vale a pena – os resultados obtidos são realmente impressionantes. O site PetaPixel fez uma série de testes com o sistema utilizando uma foto de divulgação da câmera Rylo, que acabou de ser lançada. Veja a imagem original:

Em seguida, a imagem foi redimensionada para 500px de largura.

A foto de 500px de largura foi então resampliada no Photoshop para 2000px de largura usando a opção “Preserve Details (enlargement)” produzindo uma foto com texturas horríveis (veja os dedos):

Mas resampliando a foto de 500px usando o Let’s Enhance foi produzida uma versão muito mais limpa da imagem que teve restauradas as texturas realistas nas mãos:

Aqui está uma comparação dos recortes para ajudá-lo a ver mais facilmente a diferença:

Veja outros exemplos:

Recorte original de uma foto de Linnea Sandbakk
Upscale com Photoshop
Upscale com Let’s Enhance
Recorte original de uma foto de Brynna Spencer
Upscale com Photoshop
Upscale com Let’s Enhance
Recorte original de uma foto retirada do banco de imagens Pexels
Upscale com Photoshop
Upscale com Let’s Enhance

O Let’s Enhance foi criado por Alex Savsunenko e Vladislav Pranskevičius, um Ph.D. de química e um antigo CTO respectivamente, que vêm construindo o software nos últimos dois meses e meio. O sistema está atualmente em sua 1ª versão e será continuamente melhorado com base nas necessidades e feedback dos usuários.

A rede neural atual foi “treinada com um subconjunto muito amplo de imagens que incluiu retratos com uma taxa de aproximadamente 10%”, diz Savsunenko.

Ele explica que a ideia é criar redes separadas para cada tipo de imagem e detectar o tipo carregado e aplicar uma rede apropriada. A versão atual tem obtido melhores resultados com imagens de animais e paisagens.

EnhanceNet-PAT

EnhanceNet-PAT é um novo algoritmo desenvolvido por cientistas no Instituto Max Planck para Sistemas Inteligentes em Tübingen, na Alemanha. Essa nova tecnologia também tem apresentado resultados impressionantes. Veja abaixo um exemplo com uma foto original de um pássaro:

Os cientistas tomaram a foto e criaram esta versão de baixa resolução na qual todos os detalhes finos são perdidos:

A versão de baixa resolução foi então processada pelo EnhanceNet-PAT, criando uma versão de alta definição artificialmente aprimorada que é praticamente indistinguível da foto original.

As tecnologias tradicionais de upscaling tentam preencher pixels e detalhes perdidos calculando com base nos pixels circundantes. Porém, os resultados desses tipos de estratégias têm sido insatisfatórios. O que os cientistas estão explorando agora é a utilização de inteligência artificial para que a máquina “aprenda” como devem ser as fotos de baixa resolução, estudando as versões originais de alta resolução.

Uma vez treinados desta forma, os algoritmos podem tirar novas fotos de baixa resolução e fazer uma melhor adivinhação de uma versão “original” de alta resolução dessa foto.

“Ao ser capaz de detectar e gerar padrões em uma imagem de baixa resolução e de aplicar esses padrões no processo de upsampling, o EnhanceNet-PAT pensa como as penas do pássaro devem se parecer e adiciona pixels extras à imagem de baixa resolução de acordo” afirma o Instituto Max Planck.

Para saber mais sobre os detalhes técnicos do EnhanceNet-PAT, acesse o site do projeto de pesquisa.

Sair da versão mobile