Tendência

DALL-E 3 dentro do ChatGPT: uma nova era para geração de imagens IA

No rápido mundo da evolução da Inteligência Artificial, a OpenAI surpreende o mercado com o lançamento da tão aguardada DALL-E 3, uma revolução no campo da geração de imagens. Esta nova versão da renomada IA traz uma grande inovação: a integração com o poderoso ChatGPT. Assim, os usuários poderão criar imagens no DALL-E 3 dentro do ChatGPT.

A Sintonia Perfeita do DALL-E 3 com o ChatGPT

DALL-E 3 dentro do ChatGPT: uma nova era para geração de imagens IA

A OpenAI anunciou que o DALL-E 3 foi concebido desde o princípio para uma perfeita integração ao ChatGPT. Isso possibilita aos usuários utilizar o ChatGPT como um parceiro de brainstorming e refinamento de prompts. Basta solicitar ao ChatGPT o que deseja ver, desde uma simples frase até um detalhado parágrafo.

Além da empolgante integração com o aclamado chatbot (disponível apenas na versão paga), o DALL-E 3 transcende sua versão anterior ao compreender demandas mais complexas. De acordo com o diretor da OpenAI, Sam Altman, essa nova tecnologia se adapta com facilidade às descrições textuais, exigindo menos habilidades técnicas dos usuários para elaboração dos prompts, ou seja, todo o processo de criação das imagens com a ajuda do ChatGPT será muito mais simples.

Um Salto na Precisão

“Os sistemas modernos de texto para imagem têm a tendência de negligenciar palavras ou descrições, forçando os usuários a aprenderem a engenharia de prompts”, afirma a OpenAI. O DALL-E 3 representa um notável avanço na capacidade de gerar imagens que correspondem precisamente ao texto fornecido.

“Até mesmo com o mesmo prompt, o DALL-E 3 demonstra melhorias significativas em comparação com o DALL-E 2”, destaca a empresa, apresentando as imagens abaixo como exemplo. Ambas as versões criaram representações para o prompt “Uma pintura em óleo expressiva de um jogador de basquete enterrando, retratada como a explosão de uma nebulosa.”

DALL-E 2 (esquerda) vs DALL-E 3 (Imagem: Divulgação/OpenAI)

Exemplos Práticos no X do DALL-E 3

A OpenAI não apenas fala, mas também mostra. Um conjunto de exemplos de prompts e seus resultados foi publicado no X (antigo Twitter) para demonstrar o potencial dessa inovação. Se incorporado ao uso diário da ferramenta, isso promete catalisar a já evidente “revolução das IAs generativas” que permeia o ano de 2023.

“Um edifício de arquitetura moderna com grandes janelas de vidro, situado numa falésia com vista para um oceano sereno ao pôr do sol.”
Como criar imagens no ChatGPT com o DALL-E 3
“Uma mulher de meia-idade de ascendência asiática, com cabelos escuros com mechas prateadas, parece fraturada e lascada, intrinsecamente incrustada em um mar de porcelana quebrada. A porcelana brilha com padrões de tinta respingados em uma mistura harmoniosa de azuis brilhantes e foscos, verdes, laranjas e vermelhos, capturando sua dança em uma justaposição surreal de movimento e quietude. Seu tom de pele, um tom claro como a porcelana, adiciona uma qualidade quase mística à sua forma.

Além das características técnicas inovadoras, dois aspectos se destacam no post do blog da OpenAI: aprimoramento da segurança e um controle criativo aprimorado. A empresa assegura que a nova tecnologia possui “mitigações para recusar solicitações que pedem [criações de] uma figura pública pelo nome”. Quanto ao controle criativo, a OpenAI promete que a ferramenta irá recusar solicitações para criar imagens “inspiradas” no trabalho de artistas vivos. Além disso, os criadores agora têm o poder de solicitar a remoção de suas imagens do treinamento de futuros modelos de geração de imagens.

Lançamento do DALL-E 3

Apesar do anúncio recente, o DALL-E 3 ainda não está disponível para o público em geral. A partir do início de outubro, será distribuída exclusivamente para os assinantes do ChatGPT Plus e do pacote Enterprise, prometendo inaugurar uma nova era na geração de imagens por meio da IA.

Artigos relacionados