A IA, cujo nome é derivado da personagem WALL-E, da Pixar, e inspirado também no dono dos mais belos bigodes do mundo, o pintor espanhol Salvador Dalí, consegue criar imagens um tanto curiosas ao mesclar animais e objetos, frutas, vegetais e afins também com objetos ou praticamente qualquer coisa que você imaginar (ou não imaginar, dada a quantidade de parâmetros). Segundo o blog da OpenAI, isso mostra que a manipulação de imagens a partir de textos está finalmente ao alcance de mãos humanas. Se é que podemos considerar isso como humano – mas aí a questão fica para escritores e filósofos. Ainda de acordo com o blog, o objetivo é analisar em que medida essa ferramenta consegue impactar determinadas profissões e facilitar certos trabalhos, como desenvolvimento de modelos industriais e outras produções do gênero.
Como a inteligência artificial cria imagens com o texto?
Usando combinações dos 12 bilhões de parâmetros entre texto e imagem, ela gera um modelo perfeito (ou quase perfeito, dependendo do que você colocar) daquilo que foi escrito. Pode parecer loucura só lendo essa matéria, mas a seguir deixo algumas imagens do que a IA é capaz e vocês tirem suas próprias conclusões. Ah, detalhe: ela consegue desenhar vários objetos de uma vez também.
Achou isso curioso? Pois bem, não se preocupe que há mais. Muito mais. Considerando que a GPT-3 consegue escrever e prever textos com precisão quase literária, não é de se surpreender que ela também seja capaz de entender comandos como “o mesmo gato na parte de cima e como esboço na parte de baixo“. Até aqui você pode até considerar que a inteligência artificial cria imagens relacionando alguns conceitos que são mais ou menos semelhantes em algum grau (ainda que uma poltrona e um abacate não sejam exatamente parentes), mas ela também é capaz de montar fotos com coisas um tanto diferentes, quase como um Photoshop automático. Outras informações muito legais que os desenvolvedores forneceram são as de que a inteligência artificial cria imagens de qualquer canto do mundo: ela reconhece espaços geográficos e mesmo comidas típicas de países distantes. Além disso, a tecnologia pesquisada pela OpenAI também consegue traduzir frases e passá-las para o espectro visual numa habilidade chamada pelos especialistas de zero-shot reasoning. Caso queira saber mais, não deixe de acessar o site da OpenAi, onde há vários exemplos de fotos como essa. Fontes: Geekologie | OpenAI