O que é Sora, a revolucionária IA para criar vídeos a partir de textos
Descubra o que é o Sora e aprenda os fundamentos do uso desta ferramenta inovadora de IA para criar vídeos impressionantes a partir de textos
A OpenAI lançou hoje (15.02.2024) o Sora, uma plataforma com inteligência artificial (IA) que permite criar vídeos únicos e impressionantes a partir de prompts de texto. Depois de revolucionar o mundo da inteligência artificial com o ChatGPT, agora a empresa aposta na geração de vídeos a partir de textos. E o Sora abre possibilidades criativas inimagináveis ao alcance de qualquer pessoa.
“O Sora pode criar vídeos de até 60 segundos com cenas altamente detalhadas, movimentos de câmera complexos e vários personagens com emoções vibrantes”, disse a OpenAI. Neste artigo, vamos explicar o que é o Sora, como funciona o Sora, ver alguns vídeos e seus prompts.
O que é o Sora da OpenAI, a inteligência artificial para criar vídeos a partir de textos
O que é o Sora, da OpenAI? O Sora é um modelo de IA que pode criar vídeos realistas a partir de instruções de texto (prompts). Sora pode gerar vídeos de até um minuto de alta qualidade visual seguindo exatamente às instruções definidas nos textos pelo usuário. O Sora também pode gerar um vídeo baseado em uma imagem estática, bem como preencher quadros faltantes em um vídeo existente ou estendê-lo.
Sora também pode criar vídeos IA em widescreen 1920x1080p, vídeos verticais 1080×1920 e em outros formatos. Isso permite que o Sora crie conteúdos para diferentes dispositivos. Ele também permite criar rapidamente protótipos de conteúdo em tamanhos menores antes de gerar em resolução total – tudo com o mesmo modelo.
Sora é capaz de gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos do assunto e do fundo. O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico. Veja abaixo alguns exemplos de vídeos criados pelo Sora da OpenAI e os prompts usados:
Como funciona o Sora?
Depois de ver os impressionantes vídeos criados pelo Sora, nossa dúvida é: como funciona o Sora? Como ele cria vídeos a partir de textos? O Sora usa uma técnica chamada “difusão”, que cria imagens a partir de pontos aleatórios, por isso, o vídeo inicialmente tem uma aparência de ruído estático (como os ruídos de uma TV fora do ar). Mas aos poucos, o Sora transforma o vídeo num conteúdo de alta qualidade visual. A técnica é muito similar a usada para criar fotos com inteligência artificial a partir de textos. Veja como isso funciona no infográfico abaixo:
A própria OpenAI confirmou isso: “[O Sora] usa a técnica de recaptação do (robô) DALL-E 3, que envolve a geração de legendas altamente descritivas para os dados de treinamento visual. Como resultado, o modelo [Sora] é capaz de seguir com mais fidelidade as instruções de texto do usuário no vídeo gerado”, diz a OpenAI.
Como usar o Sora?
Por enquanto, o Sora está disponível apenas para um grupo restrito de usuários da própria OpenAI e para alguns artistas visuais, cineastas e designers escolhidos como beta testers da nova ferramenta. Mas assim que a OpenAI liberar uma versão para todos os usuários, vamos publicar aqui no iPhoto Channel. Então, fique ligado para testar essa revolução no mundo da criação de vídeos.