O que parecia ser impossível está se transformando em realidade. Recentemente postamos aqui no iPhoto Channel uma matéria sobre o projeto das metalentes, uma tecnologia revolucionária pode eliminar lentes de câmeras fotográficas. Porém, era apenas um conceito em estudo e desenvolvimento. Mas agora, um grupo de pesquisadores da Tokyo Tech criaram uma nova câmera fotográfica sem lente que usa aprendizado de máquina e consegue capturar fotos nítidas de forma rápida e precisa.
“Sem as limitações de uma lente, a câmera sem lente poderia ser ultra-miniatura, o que poderia permitir novas aplicações que estão além da nossa imaginação”, disse o professor Masahiro Yamaguchi, do Instituto de Tecnologia de Tóquio, coautor do projeto de pesquisa.
A ideia de uma câmera fotográfica sem lente não é nova. Já foram feitas algumas tentativas desde 2013. Mas até então os projetos esbarraram na falta de nitidez das imagens e na demora do processamento das fotos. Isso porque uma câmera sem lente possui apenas uma máscara fina na frente de um sensor de imagem que codifica e reconstrói matematicamente as cenas.
Câmeras sem lentes anteriores, usavam métodos para controlar a luz que atinge o sensor de imagem e realizar medições sofisticadas de como a luz interage com a máscara física e o sensor de imagem para então reconstruir uma imagem. Sem uma maneira de focar a luz, uma câmera sem lente captura uma imagem borrada, que deve ser reconstruída em uma imagem mais nítida usando um algoritmo. Veja isso na prática através da ilustração abaixo:
Ao entender como a luz interage com uma máscara fina na frente do sensor de imagem, um algoritmo pode decodificar as informações de luz e reconstruir uma cena focada. No entanto, o processo de decodificação é extremamente desafiador e consome muitos recursos. Além de demandar tempo, gerar uma boa qualidade de imagem requer um modelo físico perfeito. Se um algoritmo for baseado em uma aproximação imprecisa de como a luz interage com a máscara e o sensor, o sistema da câmera falhará.
Em vez de usar uma abordagem de decodificação baseada em modelo, a equipe da Tokyo Tech desenvolveram um método de reconstrução com um novo algoritmo que usa aprendizado de máquina. Ele é baseado em uma técnica chamada Vision Transformer (ViT) e promete um raciocínio global aprimorado.
O novo método, utilizando redes neurais e um transformador conectado, promete melhores resultados. Além disso, os erros de reconstrução são reduzidos e os tempos de computação são menores. A equipe acredita que o método pode ser usado para captura em tempo real de imagens de alta qualidade, algo que não acontecia com as câmeras sem lentes anteriores. Se isso realmente evoluir ainda mais nos próximos anos estaremos diante de uma das maiores revoluções no processo de captura de imagens da história da fotografia. Vamos estar acompanhando e trazendo sempre as novidades das câmeras fotográficas sem lentes.
Leia abaixo um resumo do estudo publicado pelos autores da pesquisa Xuixi Pan, Xiao Chen, Saori Takeyama e Masahiro Yamaguchi:
Uma câmera sem lente baseada em máscara codifica opticamente a cena com uma máscara fina e reconstrói a imagem posteriormente. A melhoria da reconstrução da imagem é um dos assuntos mais importantes na imagem sem lentes. As abordagens convencionais de reconstrução baseadas em modelos, que alavancam o conhecimento do sistema físico, são suscetíveis à modelagem imperfeita do sistema.
A reconstrução com uma rede neural profunda orientada por dados (DNN) pura evita essa limitação, tendo assim potencial para fornecer uma melhor qualidade de reconstrução. No entanto, as abordagens de reconstrução DNN puras existentes para imagens sem lentes não fornecem um resultado melhor do que as abordagens baseadas em modelo.
Nós revelamos que a propriedade de multiplexação na óptica sem lentes torna as características globais essenciais na compreensão do padrão opticamente codificado. Adicionalmente, todas as abordagens de reconstrução de DNN existentes aplicam redes totalmente convolucionais (FCNs) que não são eficientes no raciocínio de recursos globais.
Com esta análise, pela primeira vez até onde sabemos, uma rede neural totalmente conectada com um transformador para reconstrução de imagem é proposta. A arquitetura proposta é melhor no raciocínio de recursos globais e, portanto, aprimora a reconstrução. A superioridade da arquitetura proposta é verificada comparando-se com as abordagens baseadas em modelo e baseadas em FCN em um experimento óptico. e, portanto, melhora a reconstrução.
A superioridade da arquitetura proposta é verificada comparando-se com as abordagens baseadas em modelo e baseadas em FCN em um experimento óptico. e, portanto, melhora a reconstrução. A superioridade da arquitetura proposta é verificada comparando-se com as abordagens baseadas em modelo e baseadas em FCN em um experimento óptico.