Tendência

O que é Sora, a revolucionária IA para criar vídeos a partir de textos

Descubra o que é o Sora e aprenda os fundamentos do uso desta ferramenta inovadora de IA para criar vídeos impressionantes a partir de textos

A OpenAI lançou hoje (15.02.2024) o Sora, uma plataforma com inteligência artificial (IA) que permite criar vídeos únicos e impressionantes a partir de prompts de texto. Depois de revolucionar o mundo da inteligência artificial com o ChatGPT, agora a empresa aposta na geração de vídeos a partir de textos. E o Sora abre possibilidades criativas inimagináveis ao alcance de qualquer pessoa.

“O Sora pode criar vídeos de até 60 segundos com cenas altamente detalhadas, movimentos de câmera complexos e vários personagens com emoções vibrantes”, disse a OpenAI. Neste artigo, vamos explicar o que é o Sora, como funciona o Sora, ver alguns vídeos e seus prompts.

Prompt no Sora para gerar esse vídeo: Uma mulher estilosa caminha por uma rua de Tóquio repleta de neon brilhante e sinalização animada da cidade. Ela usa uma jaqueta de couro preta, um vestido longo vermelho, botas pretas e carrega uma bolsa preta. Ela usa óculos escuros e batom vermelho. Ela caminha com confiança e casualmente. A rua é úmida e reflexiva, criando um efeito espelhado das luzes coloridas. Muitos pedestres circulam.

O que é o Sora da OpenAI, a inteligência artificial para criar vídeos a partir de textos

O que é o Sora da OpenAI, a inteligência artificial para criar vídeos a partir de textos

O que é o Sora, da OpenAI? O Sora é um modelo de IA que pode criar vídeos realistas a partir de instruções de texto (prompts). Sora pode gerar vídeos de até um minuto de alta qualidade visual seguindo exatamente às instruções definidas nos textos pelo usuário. O Sora também pode gerar um vídeo baseado em uma imagem estática, bem como preencher quadros faltantes em um vídeo existente ou estendê-lo.

Sora também pode criar vídeos IA em widescreen 1920x1080p, vídeos verticais 1080×1920 e em outros formatos. Isso permite que o Sora crie conteúdos para diferentes dispositivos. Ele também permite criar rapidamente protótipos de conteúdo em tamanhos menores antes de gerar em resolução total – tudo com o mesmo modelo.

Sora é capaz de gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos do assunto e do fundo. O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico. Veja abaixo alguns exemplos de vídeos criados pelo Sora da OpenAI e os prompts usados:

Prompt no Sora para gerar esse vídeo: Um trailer de filme apresentando as aventuras do homem do espaço de 30 anos usando um capacete de motocicleta tricotado de lã vermelha, céu azul, deserto de sal, estilo cinematográfico, filmado em filme 35mm, cores vivas.
Prompt no Sora para gerar esse vídeo: A cena animada apresenta um close-up de um monstro pequeno e fofo ajoelhado ao lado de uma vela vermelha derretida. O estilo artístico é 3D e realista, com foco na iluminação e textura. O clima da pintura é de admiração e curiosidade, enquanto o monstro olha para a chama com olhos arregalados e boca aberta. A sua pose e expressão transmitem uma sensação de inocência e diversão, como se estivesse a explorar o mundo à sua volta pela primeira vez. O uso de cores quentes e iluminação dramática realça ainda mais a atmosfera aconchegante da imagem.

Como funciona o Sora?

Prompt no Sora para gerar esse vídeo: A câmera enfrenta diretamente edifícios coloridos em Burano, Itália. Um adorável dálmata olha através de uma janela de um prédio no térreo. Muitas pessoas caminham e pedalam pelas ruas do canal em frente aos edifícios.

Depois de ver os impressionantes vídeos criados pelo Sora, nossa dúvida é: como funciona o Sora? Como ele cria vídeos a partir de textos? O Sora usa uma técnica chamada “difusão”, que cria imagens a partir de pontos aleatórios, por isso, o vídeo inicialmente tem uma aparência de ruído estático (como os ruídos de uma TV fora do ar). Mas aos poucos, o Sora transforma o vídeo num conteúdo de alta qualidade visual. A técnica é muito similar a usada para criar fotos com inteligência artificial a partir de textos. Veja como isso funciona no infográfico abaixo:

A própria OpenAI confirmou isso: “[O Sora] usa a técnica de recaptação do (robô) DALL-E 3, que envolve a geração de legendas altamente descritivas para os dados de treinamento visual. Como resultado, o modelo [Sora] é capaz de seguir com mais fidelidade as instruções de texto do usuário no vídeo gerado”, diz a OpenAI.

Como usar o Sora?

Por enquanto, o Sora está disponível apenas para um grupo restrito de usuários da própria OpenAI e para alguns artistas visuais, cineastas e designers escolhidos como beta testers da nova ferramenta. Mas assim que a OpenAI liberar uma versão para todos os usuários, vamos publicar aqui no iPhoto Channel. Então, fique ligado para testar essa revolução no mundo da criação de vídeos.

Artigos relacionados